Apprentissage non supervisé

Apprentissage automatique pour trouver des modèles cachés ou des structures intrinsèques dans les données

L'apprentissage non supervisé est un type d'algorithme d'apprentissage automatique utilisé pour tirer des conclusions à partir de jeux de données composés de données d'entrée sans réponses catégorisées.

La méthode d'apprentissage non supervisé la plus commune est le partionnement de données, qui est utilisé pour effectuer une analyse exploratoire des données afin de trouver des modèles cachés ou des regroupements dans les données. Les clusters sont conçus au moyen d'une mesure de similarité définie par des métriques telles que la distance euclidienne ou la distance probabiliste.

Les algorithmes de clustering communs comprennent :

  • Regroupement hiérarchique : permet de développer une hiérarchie de clusters à plusieurs niveaux en créant un arbre de clusters
  • Partionnement k-means : partitionne les données dans k clusters distincts selon la distance aubarycentre d'un cluster
  • Modèle de mélange gaussien : modélise les clusters comme mélange de composants suivant la loi normale multivariée
  • Carte auto adaptative : utilise les réseaux neuronaux qui apprennent la topologie et la répartition des données
  • Modèle de Markov caché : utilise les données observées pour récupérer la séquence d'états

Les méthodes d'apprentissage non supervisé sont utilisées en bio-informatique pour les analyses de séquences et les regroupements génétiques ; en data mining pour l'extraction de séquences et de modèles ; en imagerie médicale pour les segmentations d'images ; et en vision par ordinateur pour la reconnaissance d'objets.

Pour plus d'informations sur les algorithmes d'apprentissage non supervisé, consultez les sections Statistics and Machine Learning Toolbox™ et Neural Network Toolbox™.

Voir aussi : Statistics and Machine Learning Toolbox, MATLAB, Statistics and Machine Learning Toolbox, Neural Network Toolbox, apprentissage automatique, apprentissagesupervisé, AdaBoost, analyse de données, modélisation mathématique

Les challenges du Machine Learning