IA & Maths de Lycée : De la Terminale à la Révolution IA, Papa Séga WADE

Ce webinaire s'adresse aux lycéens et étudiants de première année qui se demandent à quoi servent vraiment les mathématiques. La réponse est spectaculaire : chaque outil que vous apprenez en cours, la fonction exponentielle, les dérivées, les vecteurs, est un rouage fondamental de l'intelligence artificielle moderne.

Message clé : Vous utilisez déjà des réseaux de neurones chaque jour (LinkedIn, YouTube, Maps, correcteur orthographique). Ce webinaire démonte les mécanismes et montre que les maths du lycée sont exactement ce qu'il faut pour les comprendre, et les construire.

Plan du webinaire

L'IA Partout Autour de Nous
Le Neurone : Du Cerveau aux Maths
L'Apprentissage : Comment l'IA Apprend
Réseaux Profonds : Assembler les Neurones
Réseaux Convolutifs : Comment l'Ordinateur Voit
L'IA en Afrique : Cas Concrets
Métiers d'Avenir et Parcours

1. L'IA Partout Autour de Nous

Une journée pilotée par l'IA

De votre réveil jusqu'au soir, l'IA orchestre silencieusement votre journée. Et derrière chaque application, ce sont des mathématiques que vous connaissez.

Révélation : Toutes ces applications utilisent des mathématiques que vous connaissez déjà. LinkedIn → Théorie des graphes. Maps → Optimisation de trajets. YouTube → Probabilités conditionnelles. Correcteur → Statistiques & vecteurs.

Timeline : De la Logique Mathématique à l'IA Générative

2. Le Neurone : Du Cerveau aux Maths

Un neurone, c'est quoi ?

Analogie concrète : un neurone artificiel, c'est comme un étudiant qui prend une décision d'admission.

Entrées $(x_1, x_2, x_3)$ : ses notes en maths, physique, français
Poids $(w_1, w_2, w_3)$ : l'importance accordée à chaque matière
Biais $(b)$ : un bonus ou malus personnel
Sortie : admis ou refusé ?

Le calcul mathématique s'écrit :

$$z = w_1 x_1 + w_2 x_2 + w_3 x_3 + b$$

Vous reconnaissez ? C'est une combinaison linéaire, vue en Première !

La question choc

Question : Quelle équation mathématique permet à votre téléphone de reconnaître votre visage et pas celui de votre frère jumeau ?

Réponse : une fonction que vous connaissez déjà, la fonction exponentielle !

$$\sigma(z) = \frac{1}{1 + e^{-z}}$$

Le Perceptron : schéma complet

Avec les notes $x_1=16$, $x_2=12$, $x_3=14$ et les poids $w_1=0.5$, $w_2=0.3$, $w_3=0.2$, $b=2$ :

Calcul étape par étape

Étape 1, Agrégation (combinaison linéaire, Maths 1ère) :

$$z = 0.5 \times 16 + 0.3 \times 12 + 0.2 \times 14 + 2 = 8 + 3.6 + 2.8 + 2 = \boxed{16.4}$$

Étape 2, Fonction sigmoïde (fonction exponentielle, Terminale) :

$$\sigma(z) = \frac{1}{1 + e^{-z}} = \frac{1}{1 + e^{-16.4}} \approx \boxed{0.89}$$

Interprétation : 89% de chance d'être admis ! Le neurone « pense » que cet élève réussira.

La fonction sigmoïde, graphique

La sigmoïde écrase toute valeur réelle dans l'intervalle $]0, 1[$, ce qui en fait une probabilité naturelle.

Révélation : vous connaissez déjà tout !

3. L'Apprentissage : Comment l'IA Apprend

Types d'apprentissage

Il existe deux grandes familles :

Apprentissage supervisé : les données $(x_i, y_i)$ sont étiquetées. Le modèle $f_\theta$ apprend à prédire $y$ à partir de $x$. Exemple : prédire la note d'un élève à partir de ses résultats passés.
Apprentissage non supervisé : les données $\{x_i\}$ ne sont pas étiquetées. Le modèle découvre automatiquement des structures cachées (clusters, réductions de dimension). Exemple : segmenter des clients en groupes sans savoir à l'avance combien il y en a.

Le problème : minimiser l'erreur

Cas concret : prédire la récolte d'arachide (gerte) au Sénégal.

La fonction de perte (Mean Squared Error) mesure l'écart entre prédiction et réalité :

$$L = (y_{\text{vrai}} - y_{\text{pred}})^2$$

La Descente de Gradient

Analogie : vous êtes sur une montagne dans le brouillard. La dérivée vous dit dans quelle direction descendre. Vous faites des petits pas jusqu'à atteindre le minimum, l'endroit où l'erreur est la plus faible.

Mathématiques de la Descente de Gradient

1. Le Gradient (dérivée partielle) :

$$\nabla L = \frac{\partial L}{\partial w} \quad \text{avec} \quad L = (y_{\text{vrai}} - y_{\text{pred}})^2 \quad \text{et} \quad y_{\text{pred}} = wx + b$$

2. Mise à jour des poids :

$$\boxed{w_{\text{nouveau}} = w_{\text{ancien}} - \alpha \cdot \frac{\partial L}{\partial w}}$$

où $\alpha$ = taux d'apprentissage (learning rate), la taille des pas

Le symbole ∂ ("d rond") : au lycée on dérive par rapport à une seule variable $\frac{df}{dx}$. En IA, $L$ dépend de $w$ et $b$, donc on utilise la dérivée partielle laser $\frac{\partial L}{\partial w}$, on vise $w$ et on gèle $b$ comme une constante. C'est exactement la même règle !

La dérivée de la sigmoïde se simplifie élégamment :

$$\sigma'(z) = \sigma(z)\,(1 - \sigma(z))$$

Zoom sur le symbole ∂, le "d rond"

Comment passe-t-on de la dérivée classique du lycée à la dérivée partielle utilisée en IA ? La comparaison ci-dessous rend ce saut limpide.

Convergence : l'IA apprend pas à pas

4. Réseaux Profonds : Assembler les Neurones

Deep Neural Network, Reconnaissance faciale

Un réseau profond empile plusieurs couches de neurones. Chaque couche extrait des caractéristiques de plus en plus abstraites : pixels → contours → formes → visage → identité.

Hiérarchie d'apprentissage : chaque couche extrait des caractéristiques de plus en plus abstraites. C'est pourquoi on parle de "deep" (profond) learning, la profondeur = le nombre de couches.

Rétropropagation : comment l'IA corrige ses erreurs

Scénario : l'IA a confondu Ibrahima avec Seynabou. Comment corriger ?

Formule de rétropropagation, Règle de la chaîne

L'algorithme utilise la règle de dérivation des fonctions composées que vous connaissez en Terminale !

$$\frac{\partial L}{\partial w_1} = \textcolor{red}{\frac{\partial L}{\partial y}} \times \textcolor{orange}{\frac{\partial y}{\partial h^3}} \times \textcolor{gold}{\frac{\partial h^3}{\partial h^2}} \times \textcolor{lime}{\frac{\partial h^2}{\partial h^1}} \times \frac{\partial h^1}{\partial w_1}$$

Révélation : C'est exactement la règle de dérivation des fonctions composées du lycée ! Si $f(g(h(x)))$, alors : $[f \circ g \circ h]'(x) = f'(g(h(x))) \times g'(h(x)) \times h'(x)$. La rétropropagation, c'est ça, appliqué à un réseau à des milliers de couches.

Cas pratique 1, Calculer un neurone à la main

🧮 Exercice 1, Simuler un neurone artificiel

Données : $x_1 = 0.8$, $x_2 = 0.6$, $w_1 = 0.3$, $w_2 = 0.7$, $b = -0.2$, $y_{\text{vrai}} = 1$

Calculez l'agrégation : $z = w_1 x_1 + w_2 x_2 + b$
Calculez l'activation : $\sigma(z) = \frac{1}{1+e^{-z}}$ (indice : $e^{-0.46} \approx 0.63$)
Calculez l'erreur : $L = \frac{1}{2}(y_{\text{vrai}} - \sigma(z))^2$

✓ Solution

1. $z = (0.3 \times 0.8) + (0.7 \times 0.6) + (-0.2) = 0.24 + 0.42 - 0.2 = \boxed{0.46}$

2. $\sigma(0.46) = \dfrac{1}{1 + e^{-0.46}} \approx \dfrac{1}{1 + 0.63} \approx \boxed{0.61}$

3. $L = \dfrac{1}{2}(1 - 0.61)^2 = 0.5 \times 0.1521 \approx \boxed{0.076}$

L'IA a prédit 0.61 alors qu'on attendait 1. L'erreur est faible mais l'apprentissage peut encore améliorer les poids.

Projet 1, Reconnaissance de chiffres (MNIST)

Google Colab + dataset MNIST (60 000 images de chiffres 0–9) : construire un réseau 3 couches et atteindre >95% de précision en 15 minutes.

# Mini réseau MNIST — Google Colab
import tensorflow as tf

# Charger les données
(X_train, y_train), (X_test, y_test) = tf.keras.datasets.mnist.load_data()
X_train, X_test = X_train / 255.0, X_test / 255.0  # Normalisation

# Construire le réseau
model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),   # 784 pixels → vecteur
    tf.keras.layers.Dense(128, activation='relu'),   # Couche cachée 1
    tf.keras.layers.Dense(64,  activation='relu'),   # Couche cachée 2
    tf.keras.layers.Dense(10,  activation='softmax') # 10 chiffres (0-9)
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10)
print(f"Précision test : {model.evaluate(X_test, y_test)[1]:.1%}")

5. Réseaux Convolutifs : Comment l'Ordinateur Voit

Ce que l'ordinateur « voit »

L'ordinateur ne voit pas comme nous. Là où vous voyez un visage, lui voit une matrice de nombres entre 0 (noir) et 255 (blanc).

Le mécanisme de convolution (1/2)

Un CNN déplace une petite fenêtre appelée kernel (filtre) sur toute l'image et calcule un produit scalaire à chaque position.

Le mécanisme de convolution (2/2), La formule

La convolution est une double somme, c'est une multiplication suivie d'une addition :

$$(I * K)[i,j] = \sum_{m=0}^{2} \sum_{n=0}^{2} I[i+m,\; j+n] \times K[m,n]$$

Résultat élevé → contour détecté (changement brutal de pixels)
Résultat faible → zone uniforme (rien à signaler)

Le CNN déplace cette fenêtre sur toute l'image (le « scan ») pour construire une carte d'activation.

Exercice 2, Convolution pas à pas

🧮 Exercice 2, Détection de contours

Image 3×3 : $I = \begin{bmatrix} 1 & 0 & 2 \\ 0 & \mathbf{1} & 1 \\ 2 & 0 & 1 \end{bmatrix}$ Kernel : $K = \begin{bmatrix} -1 & 0 & 1 \\ -1 & 0 & 1 \\ -1 & 0 & 1 \end{bmatrix}$

Calculez $(I * K)$ en utilisant la formule.

✓ Solution

Produits élément par élément puis somme :

$$(-1 \times 1) + (0 \times 0) + (1 \times 2) + (-1 \times 0) + (0 \times 1) + (1 \times 1) + (-1 \times 2) + (0 \times 0) + (1 \times 1)$$ $$= -1 + 0 + 2 + 0 + 0 + 1 - 2 + 0 + 1 = \boxed{1}$$

Résultat = 1 → présence d'un contour vertical !

6. L'IA en Afrique : Cas Concrets

SafaraNambi, Diagnostic agricole par CNN

La maladie du manioc détruit plus de 50% des récoltes en Afrique de l'Est. Une application mobile utilise un CNN pour analyser une photo de feuille et poser un diagnostic en 3 secondes.

L'IA « Made in Sénégal »

Ces startups recrutent des profils scientifiques, elles n'attendent que vos compétences en maths et Python.

Projet 2, Imaginez une IA pour votre communauté

Exemples d'inspiration :

Santé : diagnostic du paludisme par photo de frottis sanguin
Agriculture : prédiction du rendement en arachide selon météo + sol
Éducation : apprentissage du wolof par reconnaissance vocale
Commerce : recommandation de produits pour boutiques locales
Transport : optimisation des trajets de taxis collectifs (cars rapides)

Livrables : (1) description du problème, (2) solution IA proposée, (3) données nécessaires, (4) impact attendu. Ressources : Zindi Africa (compétitions ML africaines) · AI4D (datasets africains).

7. Métiers d'Avenir et Parcours

8. Ressources Gratuites

🎓 Cours en ligne

Coursera, Andrew Ng Machine Learning
Fast.ai, Practical Deep Learning
YouTube, 3Blue1Brown (visualisations)

⚙ Outils gratuits

Google Colab, GPU gratuit dans le navigateur
GitHub, portfolio public pour vos projets
Hugging Face, modèles pré-entraînés

🏆 Compétitions

Kaggle, compétitions mondiales de ML
Zindi Africa, compétitions africaines

👥 Communautés

MathsPSW-IA, Discord/communauté IA
LinkedIn Learning, réseau professionnel
AI4D, datasets africains

9. 3 Actions Concrètes, Cette Semaine !

Conclusion, Le Message Final

$$\boxed{\textbf{Passion} + \textbf{Maths} + \textbf{Code} = \text{Révolutionner le monde}}$$

À retenir : "Chaque équation que vous apprenez est un outil pour construire l'intelligence artificielle de demain.", Vous avez maintenant les clés mathématiques pour comprendre et construire l'IA. Le prochain grand modèle africain pourrait venir de vous.

Pour aller plus loin

Deux articles complémentaires sur ce blog :

Introduction aux LLMs, les architectures Transformer qui propulsent ChatGPT et Gemini
Les innovations Qwen3, MoE, budget de pensée, distillation fort-faible
Introduction au Deep Learning, approfondir les concepts vus ici

Contact & Communauté

Dr. Papa Séga WADE · Ingénieur de Recherche IA, Orange Innovation

papa-sega.wade@m4x.org Papa Séga WADE, PhD, LinkedIn MathsPSW-IA, rejoignez la communauté IA francophone . Accédez au notebook Google Colab .

▶ Revoir le webinaire complet

Miniature du webinaire : De la Terminale à la Révolution de l'IA

De la Terminale à la Révolution de l'IA, webinaire complet sur YouTube