Apprentissage automatique avec MATLAB

Construire des modèles prédictifs et découvrir des motifs utiles dans des données

Les algorithmes d’apprentissage automatique (aussi appelé « Machine Learning ») utilisent des méthodes calculatoires pour « apprendre » et tirer de l’information directement depuis vos données sans assumer une équation prédéterminée en tant que modèle. Ils peuvent améliorer leurs performances lorsque vous augmentez le nombre d’échantillons disponibles pour l’apprentissage.

Les algorithmes d’apprentissage automatique, qui développent des règles de décision à partir de données étiquetées d’entraînement sont connus sous la dénomination d’algorithmes par « apprentissage supervisé ». Les algorithmes d’ « apprentissage non supervisé » peuvent découvrir des structures utiles au sein de données non étiquetées.

L’apprentissage automatique et ses algorithmes sont utilisés dans de nombreuses applications telles que la finance computationnelle (attribution de notes de sûreté pour l’attribution de crédit, trading algorithmique), la biologie computationnelle (détection de tumeurs, découverte de médicaments et séquençage de l’ADN), la production d’énergie (prévision des prix et de la courbe de charge), le traitement automatique du langage naturel, la reconnaissance d’images et de sons, le marketing ou encore les systèmes de recommandation. Le « machine learning » est souvent utilisé dans le cadre d’application sur des données volumineuses (Big Data).

Ces données possèdent de nombreux prédicteurs (caractéristiques) et sont trop complexes pour un simple modèle paramétrique. L’apprentissage automatique est par exemple utilisé pour la prévision de la courbe de charge d’électricité avec un réseau de neurones ou la classification du risque de crédit en utilisant un ensemble d’arbres de décision.

Algorithmes d’apprentissage supervisé communs

Techniques d’apprentissage supervisé pour construire des modèles prédictifs à partir de données d’entrée et de réponses connues :

  • Arbres de décision boostés et agrégés
  • Machines à vecteur de support
  • Classifieur bayésien naïf
  • Classification des k plus proches voisins
  • Analyse discriminante
  • Réseaux de neurones

Algorithmes d’apprentissage non supervisé communs

Techniques d’apprentissage non supervisé pour trouver des motifs cachés ou des structures intrinsèques au cœur de données :

  • k-means et groupement hiérarchique
  • Mélanges gaussiens (utilisant la maximisation de l’espérance conditionnelle)
  • Les chaînes de Markov cachées
  • Les cartes auto-organisatrices (SOM)
  • Les réseaux de neurones par couche compétitive
  • Les réseaux de neurones d’apprentissage par quantification de vecteur (LVQ)


Voir aussi: nombres aléatoires, lissage, analyse de données, modélisation mathématiques, détection de contours, le recalage d’images

Le Machine Learning avec le cas Netflix