Le Machine Learning encore appelé apprentissage automatique ou apprentissage statistique est un ensemble de procédures utilisant les méthodes statistiques et visant à prédire des situations qu’on ignore à priori ou des événements qui ne se sont pas encore produits. Ce type de technique s’avère très utile car participant activement au processus de décision dans plusieurs domaines du vivant. Nous pouvons citer :
- La définition des stratégies de ventes (Marketing)
- L’investissement en bourse (Finances)
- Les résolutions prises par un gouvernement pour favoriser la croissance économique
- La détection de maladies en imagerie médicale (Médecine)
- Etc.
La Vision par ordinateur (Computeur Vision) est l’une des applications du Machine Learning. Elle l’utilise pour pouvoir étiqueter les images, c’est-à-dire reconnaître ce à quoi correspond une image quelconque. Citons quelques exemples :
- La Computeur Vision permet de détecter des anomalies sur les résultats d’un scanner du cerveau ou de tout organe ;
- La Computeur Vision est à la base des voitures autonomes. Entendons par voiture autonome une voiture qui peut rouler sans l’intervention d’un être humain tout en évitant les obstacles ;
- La Computeur Vision est à la base des procédures de reconnaissance faciale utilisées par la police pour identifier un suspect.
- Elle est à l’origine de la détection des visages, des sourires ou de tout autre signe du visage par les appareils photos.
En Vision par ordinateur, deux grandes objectifs sont poursuivis : la classification d’images et la segmentation d’image.
Lorsqu’on soumet une image à un algorithme de classification d’image, cet algorithme est capable de reconnaître l’élément figurant sur cette image. Si les appareils photos détectent la nictation (clignement des yeux), c’est parce qu’ils intègrent un algorithme de classification d’image qui leur permet de reconnaître ce signe particulier.
Quant à la segmentation d’image, elle permet d’identifier des éléments ou des objets dans une image. Lorsque nous prenons une salle de classe en photo, nous obtenons une seule image mais cette dernière contient tout ce qui est présent dans la classe en l’occurrence les élèves, le tableau, les bancs, etc. Ici, la segmentation de l’image permettra de séparer les différents éléments de cette image en distinguant les élèves, le tableau, les bancs ; en les établissant comme des éléments uniques et c’est ici que la classification et la segmentation d’images se rencontrent.
En effet, Cette propriété qu’a la segmentation d’image de séparer chaque objet de l’image permet d’optimiser les algorithmes de classification d’image.
Souvent, le data scientist désire classifier un objet précis figurant dans une image, or les photos prises comportent plus d’un élément comme le cas de la photo de classe. Si nous désirons créer un algorithme qui sache reconnaître un banc de la classe, la photo du banc prise dans la classe devra subir une segmentation qui permettra d’ôter de l’image, le tableau, les élèves car ces derniers ne pourraient que baisser les performances de notre algorithme de classification d’image. C’est la raison pour laquelle les éléments intrus de l’image d’intérêt sont appelés bruits. Il faut donc les supprimer de l’image à partir de la segmentation.
Auteur : Amiel SOSSA, Data Scientist à LESCAL
Comments