Ce webinaire s'adresse aux lycéens et étudiants de première année qui se demandent à quoi servent vraiment les mathématiques. La réponse est spectaculaire : chaque outil que vous apprenez en cours, la fonction exponentielle, les dérivées, les vecteurs, est un rouage fondamental de l'intelligence artificielle moderne.
Plan du webinaire
1. L'IA Partout Autour de Nous
Une journée pilotée par l'IA
De votre réveil jusqu'au soir, l'IA orchestre silencieusement votre journée. Et derrière chaque application, ce sont des mathématiques que vous connaissez.
Timeline : De la Logique Mathématique à l'IA Générative
2. Le Neurone : Du Cerveau aux Maths
Un neurone, c'est quoi ?
Analogie concrète : un neurone artificiel, c'est comme un étudiant qui prend une décision d'admission.
- Entrées $(x_1, x_2, x_3)$ : ses notes en maths, physique, français
- Poids $(w_1, w_2, w_3)$ : l'importance accordée à chaque matière
- Biais $(b)$ : un bonus ou malus personnel
- Sortie : admis ou refusé ?
Le calcul mathématique s'écrit :
$$z = w_1 x_1 + w_2 x_2 + w_3 x_3 + b$$Vous reconnaissez ? C'est une combinaison linéaire, vue en Première !
La question choc
Réponse : une fonction que vous connaissez déjà, la fonction exponentielle !
Le Perceptron : schéma complet
Avec les notes $x_1=16$, $x_2=12$, $x_3=14$ et les poids $w_1=0.5$, $w_2=0.3$, $w_3=0.2$, $b=2$ :
Calcul étape par étape
Étape 1, Agrégation (combinaison linéaire, Maths 1ère) :
$$z = 0.5 \times 16 + 0.3 \times 12 + 0.2 \times 14 + 2 = 8 + 3.6 + 2.8 + 2 = \boxed{16.4}$$Étape 2, Fonction sigmoïde (fonction exponentielle, Terminale) :
$$\sigma(z) = \frac{1}{1 + e^{-z}} = \frac{1}{1 + e^{-16.4}} \approx \boxed{0.89}$$La fonction sigmoïde, graphique
La sigmoïde écrase toute valeur réelle dans l'intervalle $]0, 1[$, ce qui en fait une probabilité naturelle.
Révélation : vous connaissez déjà tout !
3. L'Apprentissage : Comment l'IA Apprend
Types d'apprentissage
Il existe deux grandes familles :
- Apprentissage supervisé : les données $(x_i, y_i)$ sont étiquetées. Le modèle $f_\theta$ apprend à prédire $y$ à partir de $x$. Exemple : prédire la note d'un élève à partir de ses résultats passés.
- Apprentissage non supervisé : les données $\{x_i\}$ ne sont pas étiquetées. Le modèle découvre automatiquement des structures cachées (clusters, réductions de dimension). Exemple : segmenter des clients en groupes sans savoir à l'avance combien il y en a.
Le problème : minimiser l'erreur
Cas concret : prédire la récolte d'arachide (gerte) au Sénégal.
La fonction de perte (Mean Squared Error) mesure l'écart entre prédiction et réalité :
$$L = (y_{\text{vrai}} - y_{\text{pred}})^2$$La Descente de Gradient
Analogie : vous êtes sur une montagne dans le brouillard. La dérivée vous dit dans quelle direction descendre. Vous faites des petits pas jusqu'à atteindre le minimum, l'endroit où l'erreur est la plus faible.
Mathématiques de la Descente de Gradient
1. Le Gradient (dérivée partielle) :
$$\nabla L = \frac{\partial L}{\partial w} \quad \text{avec} \quad L = (y_{\text{vrai}} - y_{\text{pred}})^2 \quad \text{et} \quad y_{\text{pred}} = wx + b$$2. Mise à jour des poids :
$$\boxed{w_{\text{nouveau}} = w_{\text{ancien}} - \alpha \cdot \frac{\partial L}{\partial w}}$$où $\alpha$ = taux d'apprentissage (learning rate), la taille des pas
La dérivée de la sigmoïde se simplifie élégamment :
$$\sigma'(z) = \sigma(z)\,(1 - \sigma(z))$$Zoom sur le symbole ∂, le "d rond"
Comment passe-t-on de la dérivée classique du lycée à la dérivée partielle utilisée en IA ? La comparaison ci-dessous rend ce saut limpide.
Convergence : l'IA apprend pas à pas
4. Réseaux Profonds : Assembler les Neurones
Deep Neural Network, Reconnaissance faciale
Un réseau profond empile plusieurs couches de neurones. Chaque couche extrait des caractéristiques de plus en plus abstraites : pixels → contours → formes → visage → identité.
Rétropropagation : comment l'IA corrige ses erreurs
Scénario : l'IA a confondu Ibrahima avec Seynabou. Comment corriger ?
Formule de rétropropagation, Règle de la chaîne
L'algorithme utilise la règle de dérivation des fonctions composées que vous connaissez en Terminale !
$$\frac{\partial L}{\partial w_1} = \textcolor{red}{\frac{\partial L}{\partial y}} \times \textcolor{orange}{\frac{\partial y}{\partial h^3}} \times \textcolor{gold}{\frac{\partial h^3}{\partial h^2}} \times \textcolor{lime}{\frac{\partial h^2}{\partial h^1}} \times \frac{\partial h^1}{\partial w_1}$$Cas pratique 1, Calculer un neurone à la main
Données : $x_1 = 0.8$, $x_2 = 0.6$, $w_1 = 0.3$, $w_2 = 0.7$, $b = -0.2$, $y_{\text{vrai}} = 1$
- Calculez l'agrégation : $z = w_1 x_1 + w_2 x_2 + b$
- Calculez l'activation : $\sigma(z) = \frac{1}{1+e^{-z}}$ (indice : $e^{-0.46} \approx 0.63$)
- Calculez l'erreur : $L = \frac{1}{2}(y_{\text{vrai}} - \sigma(z))^2$
1. $z = (0.3 \times 0.8) + (0.7 \times 0.6) + (-0.2) = 0.24 + 0.42 - 0.2 = \boxed{0.46}$
2. $\sigma(0.46) = \dfrac{1}{1 + e^{-0.46}} \approx \dfrac{1}{1 + 0.63} \approx \boxed{0.61}$
3. $L = \dfrac{1}{2}(1 - 0.61)^2 = 0.5 \times 0.1521 \approx \boxed{0.076}$
L'IA a prédit 0.61 alors qu'on attendait 1. L'erreur est faible mais l'apprentissage peut encore améliorer les poids.
Projet 1, Reconnaissance de chiffres (MNIST)
Google Colab + dataset MNIST (60 000 images de chiffres 0–9) : construire un réseau 3 couches et atteindre >95% de précision en 15 minutes.
# Mini réseau MNIST — Google Colab
import tensorflow as tf
# Charger les données
(X_train, y_train), (X_test, y_test) = tf.keras.datasets.mnist.load_data()
X_train, X_test = X_train / 255.0, X_test / 255.0 # Normalisation
# Construire le réseau
model = tf.keras.Sequential([
tf.keras.layers.Flatten(input_shape=(28, 28)), # 784 pixels → vecteur
tf.keras.layers.Dense(128, activation='relu'), # Couche cachée 1
tf.keras.layers.Dense(64, activation='relu'), # Couche cachée 2
tf.keras.layers.Dense(10, activation='softmax') # 10 chiffres (0-9)
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10)
print(f"Précision test : {model.evaluate(X_test, y_test)[1]:.1%}")
5. Réseaux Convolutifs : Comment l'Ordinateur Voit
Ce que l'ordinateur « voit »
L'ordinateur ne voit pas comme nous. Là où vous voyez un visage, lui voit une matrice de nombres entre 0 (noir) et 255 (blanc).
Le mécanisme de convolution (1/2)
Un CNN déplace une petite fenêtre appelée kernel (filtre) sur toute l'image et calcule un produit scalaire à chaque position.
Le mécanisme de convolution (2/2), La formule
La convolution est une double somme, c'est une multiplication suivie d'une addition :
$$(I * K)[i,j] = \sum_{m=0}^{2} \sum_{n=0}^{2} I[i+m,\; j+n] \times K[m,n]$$- Résultat élevé → contour détecté (changement brutal de pixels)
- Résultat faible → zone uniforme (rien à signaler)
Le CNN déplace cette fenêtre sur toute l'image (le « scan ») pour construire une carte d'activation.
Exercice 2, Convolution pas à pas
Image 3×3 : $I = \begin{bmatrix} 1 & 0 & 2 \\ 0 & \mathbf{1} & 1 \\ 2 & 0 & 1 \end{bmatrix}$ Kernel : $K = \begin{bmatrix} -1 & 0 & 1 \\ -1 & 0 & 1 \\ -1 & 0 & 1 \end{bmatrix}$
Calculez $(I * K)$ en utilisant la formule.
Produits élément par élément puis somme :
$$(-1 \times 1) + (0 \times 0) + (1 \times 2) + (-1 \times 0) + (0 \times 1) + (1 \times 1) + (-1 \times 2) + (0 \times 0) + (1 \times 1)$$ $$= -1 + 0 + 2 + 0 + 0 + 1 - 2 + 0 + 1 = \boxed{1}$$Résultat = 1 → présence d'un contour vertical !
6. L'IA en Afrique : Cas Concrets
SafaraNambi, Diagnostic agricole par CNN
La maladie du manioc détruit plus de 50% des récoltes en Afrique de l'Est. Une application mobile utilise un CNN pour analyser une photo de feuille et poser un diagnostic en 3 secondes.
L'IA « Made in Sénégal »
Ces startups recrutent des profils scientifiques, elles n'attendent que vos compétences en maths et Python.
Projet 2, Imaginez une IA pour votre communauté
Exemples d'inspiration :
- Santé : diagnostic du paludisme par photo de frottis sanguin
- Agriculture : prédiction du rendement en arachide selon météo + sol
- Éducation : apprentissage du wolof par reconnaissance vocale
- Commerce : recommandation de produits pour boutiques locales
- Transport : optimisation des trajets de taxis collectifs (cars rapides)
Livrables : (1) description du problème, (2) solution IA proposée, (3) données nécessaires, (4) impact attendu. Ressources : Zindi Africa (compétitions ML africaines) · AI4D (datasets africains).
7. Métiers d'Avenir et Parcours
8. Ressources Gratuites
🎓 Cours en ligne
- Coursera, Andrew Ng Machine Learning
- Fast.ai, Practical Deep Learning
- YouTube, 3Blue1Brown (visualisations)
⚙ Outils gratuits
- Google Colab, GPU gratuit dans le navigateur
- GitHub, portfolio public pour vos projets
- Hugging Face, modèles pré-entraînés
🏆 Compétitions
- Kaggle, compétitions mondiales de ML
- Zindi Africa, compétitions africaines
👥 Communautés
- MathsPSW-IA, Discord/communauté IA
- LinkedIn Learning, réseau professionnel
- AI4D, datasets africains
9. 3 Actions Concrètes, Cette Semaine !
Conclusion, Le Message Final
$$\boxed{\textbf{Passion} + \textbf{Maths} + \textbf{Code} = \text{Révolutionner le monde}}$$Pour aller plus loin
Deux articles complémentaires sur ce blog :
- Introduction aux LLMs, les architectures Transformer qui propulsent ChatGPT et Gemini
- Les innovations Qwen3, MoE, budget de pensée, distillation fort-faible
- Introduction au Deep Learning, approfondir les concepts vus ici
Contact & Communauté
Dr. Papa Séga WADE · Ingénieur de Recherche IA, Orange Innovation