Comment créer une intelligence artificielle ?

Intelligence artificielle et machine learning, c’est quoi ?

Dans cet article, je vais aborder le sujet en vous expliquant comment créer une intelligence artificielle.

Pour commencer, si ce n’est pas encore fait, je vous invite à lire ces deux articles :

Je vais utiliser l’exemple de la vision par ordinateur et plus précisément comment fonctionne un logiciel de machine learning capable de reconnaître des nombres manuscrits.

J’expliquerai également quelles autres applications cela pourrait avoir pour vous et votre entreprise.
Cependant, je ne vais pas entrer dans les détails de mise en œuvre, ni dans les mathématiques ou la façon comme cela fonctionne, le poste va juste expliquer l’idée générale derrière ce principe.

Comment créer une intelligence artificielle capable de voir ?

Pour une machine, reconnaître quelque chose dans une image n’est pas une tâche facile.
Les machines sont assez stupides et ne peuvent pas comprendre les images. Elles peuvent seulement comprendre l’existence ou l’absence de pixels. Nous devons donc tout traduire en termes compréhensibles si nous voulons qu’ils fassent une tâche aussi simple …

Reconnaître les numéros écrits à la main

Pour entraîner un logiciel à reconnaître les numéros écrits à la main, il faut utiliser un jeu de données avec beaucoup d’exemples.

Heureusement, il existe un dataset très connu des professionnels de l’IA… Il est connu sous le nom “Base de données MNIST” et c’est un exercice très populaire quand on commence à apprendre le machine learning.

Mnist ressemble à ça :

C’est une collection de 70.000 images de tous les chiffres (de 0 à 9) écrits à la main et tous différents les uns des autres.

Si on prend l’exemple du chiffre 8, on a plusieurs milliers d’exemples du chiffre 8 écrits de façon légèrement différente.

Qu’est-ce qu’une image pour un ordinateur ?

Pour un ordinateur, chaque image de la base de donnée MNIST est en noir et blanc et fait 28 par 28 pixels, ce qui fait un total de 784 valeurs de pixels par image.

Puisque l’image est en noir et blanc, chaque valeur de pixel aura un niveau de gris, allant de 0 (complètement blanc) à 256 (complètement noir) .

En réalité, les ordinateurs ne savent pas ce qu’est une image. Les écrans d’ordinateur se limitent à allumer ou éteindre des pixels à l’intensité requise et nos cerveaux humains perçoivent ça de loin comme des images.

Mais en réalité, pour l’ordinateur, chaque image de ce jeu de données n’est autre qu’une matrice de 28 lignes par 28 colonnes, c’est-à-dire 784 valeurs indépendantes.

Comment entraîner un modèle de machine learning ?

Comment donc créer une intelligence artificielle à partir de tout ça ?

C’est très simple. Nous allons utiliser tous les exemples du chiffre 8 pour essayer “d’entraîner la machine” qu’est ce que fait qu’une image soit ou non un 8.

Chacune des 784 valeurs aura une importance dans le fait que l’image est un 8.

Puisque nous avons plusieurs exemples, nous allons essayer de trouver d’un point de vue statistique quelles sont les valeurs et la position des pixels les plus récurrents, trouvés dans les images du chiffre 8.

Cela s’appelle “Entraîner un modèle de machine learning” et ça revient juste à faire un tas de calculs automatiques pour trouver statistiquement, ce qu’est un 8 dans des milliers des matrices de 784 valeurs chacune.

Plus nous avons d’exemples de la façon dont le nombre “8” est écrit, mieux notre modèle “apprendra” les importances des pixels qui font un 8.

Il est à noter que nous allons également faire la même procédure pour tous les autres chiffres, du 0 au 9.

À la fin, notre modèle de machine learning “entraîné” sera capable de jeter un coup d’œil à une image inconnue et de dire de quel chiffre s’agît-il. Ceci s’appelle une “prédiction” ou une “inférence”

À quoi ça sert tout ça ?

Vous vous demandez certainement pourquoi faire tout ceci ?

Pourquoi se donner la peine de faire tout ça quand un humain pourrait faire la même chose en moins d’une seconde ?

Eh bien, même si un humain peut reconnaître les chiffres manuscrits, c’est quand même un travail à faible valeur ajoutée et très répétitif.

Un humain peut le faire, certes… Mais est-ce que ce n’est quand même pas un peu nul comme boulot ? Un humain est bien capable de faire plus que ça !

Et puis, nous les humains, nous nous fatiguons vite. Vous imaginez trier des chiffres toute la journée pendant des mois et des mois ? C’est quand même un peu pénible.

Une machine, de l’autre côté, peut être mandatée de répéter la même tâche ennuyante des milliards de fois.

Un logiciel ne connaît pas l’ennui, n’a pas besoin de vacances et ne sera jamais en arrêt maladie. En conclusion, il fera le job de façon efficace et ne se plaindra jamais 🙂

Comment la poste utilise la vision par ordinateur ?

Depuis des années, les services postaux du monde entier ont eu besoin d’automatiser cette tâche chronophage.

Chaque personne a en effet une écriture différente et il est nécessaire de bien trier chaque lettre avant de la donner aux facteurs.

Du coup, la poste utilise des caméras qui scannent la lettre de l’expéditeur et sont capables de reconstituer non seulement le code postal, mais aussi l’adresse.

Car après tout, si on peut créer une intelligence artificielle capable de reconnaître les chiffres manuscrits, on peut aussi en faire une autre capable de reconnaître les lettres.

Il y a d’ailleurs l’équivalent du dataset MNIST, mais pour les lettres. Celui-ci est connu sous le nom du EMNIST et ressemble un peu à ça :

Une intelligence artificielle entraînée à reconnaître les lettres manuscrites est capable de scanner un texte et le transcrire en numérique.

Au-delà des chiffres et du texte.

Les chiffres et les lettres ne sont que des inventions humaines. Le potentiel de formation d’une machine à distinguer des modèles dans les images peut être appliquée à pratiquement n’importe quoi dans le monde.

Il y a d’ailleurs l’équivalent du MNIST pour la mode. Ce dataset s’appelle tout simplement Fashion-MNIST et ressemble à ceci :

On peut donc utiliser ce jeu de données pour créer une intelligence artificielle capable de reconnaître les articles de mode dans une image…

Nous pouvons créer une intelligence artificielle qui reconnaît n’importe quoi!

Ok, alors faisons preuve de créativité ici:

Et si l’on entraînait un modèle pour reconnaître vos produits ?
Et si nous formions un modèle pour reconnaître les visages de vos clients VIP lorsqu’ils entrent dans votre magasin ?
Pouvez-vous envisager un modèle capable de trier et de classer des pièces dans une chaîne de fabrication ?
Qu’en est-il de l’enseignement des caméras de police pour reconnaître les visages des personnes disparues dans la rue ?

Avec suffisamment de données d’entraînement, nous pouvons prendre n’importe quoi dans une image (ou une vidéo) et apprendre à une machine comment les reconnaître.

On peut d’ailleurs faire ça en temps réel et les résultats sont hallucinants !

Les possibilités sont infinies et la seule limite est notre imagination 🙂

Machine Learning Lab – Intelligence Artificielle pour tous

Machine Learning Lab a l’ambition de démocratiser l’intelligence artificielle et la rendre accessible pour tous.

Souhaitez-vous aller plus loin ?

Vous souhaitez vous former à l’IA et à la data science ?
Peut être que vous avez une idée de projet d’IA à lancer ?
Ou plutôt besoin d’une compétence technique en machine learning pour un projet existant ?

Nous sommes un cabinet de conseil et formations en Intelligence Artificielle basé à Paris.