Quel est l’impact des mathématiques sur l’intelligence artificielle ?

Introduction

Aujourd’hui, on parle beaucoup d’intelligence artificielle, que ce soit pour reconnaître des visages, traduire des textes ou encore générer des images. Mais derrière ce côté technologique impressionnant, il faut se rappeler que l’IA repose avant tout… sur des mathématiques.

Vecteurs, fonctions, probabilités, dérivées : tous ces outils sont en réalité les briques de base qui permettent aux machines d’apprendre à «réfléchir».

I. Les mathématiques comme fondement de l’IA

1. Les vecteurs et les matrices : le langage de l’IA

En intelligence artificielle, toutes les données sont représentées sous forme de vecteurs.

Par exemple, une image en niveaux de gris de taille [math]28 \times 28[/math] pixels peut être vue comme un grand vecteur de dimension [math]784[/math] (puisque [math]28 \times 28 = 784[/math]). Chaque pixel correspond à une coordonnée du vecteur, qui prend une valeur entre 0 (noir) et 255 (blanc).

Les transformations appliquées à ces vecteurs sont modélisées par des matrices.

Si [math]X[/math] est un vecteur de données et [math]A[/math] une matrice de coefficients (aussi appelés poids), alors la sortie [math]Y[/math] est donnée par :

Y = A \cdot X.

Exemple concret : une matrice de rotation en dimension 2, pour tourner un point [math]x,y[/math] d’un angle [math]\theta[/math], est :

R(\theta) =
\begin{pmatrix}
\cos \theta & -\sin \theta \\
\sin \theta & \cos \theta
\end{pmatrix}

Ainsi, l’image (ou un vecteur de coordonnées) peut être transformée en multipliant par [math]R(\theta)[/math]. C’est exactement ce type de calcul matriciel qui est au cœur des réseaux de neurones modernes.

2. Les fonctions et la modélisation

L’objectif d’une IA est d’apprendre une fonction [math]f[/math] telle que :

f(x) \approx y,

où [math]x[/math] désigne les données d’entrée (par exemple, les pixels d’une image), et [math]y[/math] la sortie attendue (par exemple, « chat » ou « chien »).

Un exemple simple est la régression linéaire en 2D, où l’on cherche une fonction affine :

y = ax + b.

On ajuste les paramètres [math]a[/math] (pente) et [math]b[/math] (ordonnée à l’origine) pour que la droite passe au mieux par les points d’un nuage de données. Dans l’idée c’est ce que fait l’IA : approximer une relation entre des variables.

Mais «apprendre» une fonction veut dire trouver les bons paramètres (ici [math]a[/math] et [math]b[/math]) pour minimiser l’erreur. C’est là qu’interviennent l’optimisation et les probabilités…

II. Optimisation et probabilités : apprendre à partir des données

1. Optimisation par les dérivées

Lorsqu’on entraîne une IA, on cherche à ce que la fonction trouvée «colle» le mieux possible aux données. Pour mesurer la qualité d’un modèle, on introduit une erreur (ou fonction de coût).

Dans le cas d’une régression linéaire [math]y = ax + b[/math], une mesure classique de l’erreur est l’erreur quadratique:

E(a,b) = \sum_{i=1}^n \big( y_i - (ax_i + b) \big)^2

où [math]x_i,y_i[/math] sont les points du nuage.

Exemple concret : imaginons 3 points [math](1,2)[/math], [math](2,3)[/math], [math](3,6)[/math].

  • Si on choisit la droite [math]y = x+1[/math], alors les erreurs valent : [math](2 – (1+1))^2 = 0[/math], [math](3 – (2+1))^2 = 0[/math], [math](6 – (3+1))^2 = 4[/math]. Donc [math]E = 4[/math].
  • Si on prend [math]y = 2x[/math], alors : [math](2 – 2)^2 = 0[/math], [math](3 – 4)^2 = 1[/math], [math](6 – 6)^2 = 0[/math]. Donc [math]E = 1[/math], ce qui est mieux.

On comprend que la «bonne» droite est celle qui minimise [math]E[/math], c’est-à-dire qui a l’erreur la plus petite possible.

En pratique, quand il y a des milliers de points, on ne peut pas tester toutes les droites. Les IA utilisent alors une méthode appelée descente de gradient :

  • on part d’une droite «au hasard»,
  • on calcule si l’erreur augmente ou diminue quand on change légèrement [math]a[/math] ou [math]b[/math],
  • puis on ajuste petit à petit dans le sens qui fait baisser l’erreur.

🔒 La suite est réservée aux membres Premium

Accédez à l’intégralité des 40 sujets rédigés pour le Grand Oral de Maths.

Je veux le Pack Premium

Mises à jour de la newsletter

Saisissez votre adresse e-mail ci-dessous et abonnez-vous à notre newsletter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

error: Content is protected !!