Chapitre 4

Appliquer l'apprentissage supervisé


Dans quels contextes envisager l'apprentissage supervisé

Un algorithme d'apprentissage supervisé utilise un jeu de données d'entrée connues (le jeu de données d'apprentissage) et les réponses connues (sorties) associées à ces données. Il entraîne ainsi un modèle pour générer ensuite des prédictions raisonnables en réponse à de nouvelles données d'entrée. Utilisez l'apprentissage supervisé si vous disposez de données existantes pour le résultat que vous essayez de prédire.

Toutes les techniques d'apprentissage supervisé sont une forme de classification ou de régression.

La vidéo dure 4:35

Les techniques de classification prédisent des réponses discrètes, par exemple en indiquant si un e-mail est authentique ou un spam, ou si une tumeur est petite, moyenne ou grande. Les modèles de classification sont entraînés à classer les données en catégories. Parmi leurs applications, on peut citer l'imagerie médicale, la reconnaissance vocale et le credit scoring.

Les techniques de régression prédisent des réponses continues, par exemple des variations de température ou des fluctuations de la demande d'électricité. Parmi leurs applications, on peut citer la prévision des cours de bourse, la reconnaissance de l'écriture manuscrite et le traitement des signaux acoustiques.

Choisir l'algorithme adapté

Comme nous l'avons vu au Chapitre 1, le choix d'un algorithme de Machine Learning est effectué en procédant par tâtonnements. Il implique également un compromis entre certaines caractéristiques spécifiques des algorithmes, telles que :

  • Vitesse d’apprentissage
  • Utilisation de la mémoire 
  • Précision des prédictions sur de nouvelles données
  • Transparence ou interprétabilité (facilité avec laquelle vous pouvez comprendre les raisonnements sur lesquels se basent les prédictions d'un algorithme)

Algorithmes de classification courants

Algorithmes de régression courants