Les ingénieurs et data scientists travaillent avec des volumes de données importants et dans de nombreux formats (capteurs, images, vidéos, télémétrie, bases de données, etc.). Ils utilisent le Machine Learning pour identifier des caractéristiques dans les données et concevoir des modèles qui prédisent les futurs résultats en se basant sur des données historiques. Avec MATLAB®, vous avez immédiatement accès à des fonctions prédéfinies, à des boîtes à outils étendues et à des applications spécialisées pour la classification, la régression et le clustering. Vous pouvez :

  • Comparer des approches telles que la régression logistique, les arbres de classification, les machines à vecteurs de support, les méthodes ensemblistes et le Deep Learning.
  • Utiliser des outils d'affinement et de réduction pour créer un modèle précis capable d'extraire au mieux la puissance prédictive de vos données.
  • Intégrer des modèles de Machine Learning dans les systèmes d'entreprise, les clusters et les clouds, et embarquer ces modèles sur du matériel temps réel.

Comment choisir le meilleur modèle de classification et éviter le surajustement


Classification

Concevez des modèles pour classifier les données en différentes catégories. Vous pourrez ainsi analyser et visualiser vos données de façon plus précise.

Vous pouvez utiliser la classification dans des applications telles que l'évaluation de crédit, la détection de tumeurs et la reconnaissance faciale. Les algorithmes couramment utilisés pour la classification incluent notamment les machines à vecteurs de support (SVM), le boosting/bagging d'arbres de décision, la méthode des k plus proches voisins, la classification naïve bayésienne, l'analyse discriminante, la régression logistique et les réseaux de neurones.

Vous pouvez utiliser le Deep Learning pour atteindre un très bon niveau de précision dans le cadre de la classification d'objets, à l'aide des réseaux de neurones convolutifs.


Régression

Concevez des modèles pour prédire les données continues. Ces informations vous permettent d'effectuer des prédictions concernant les futurs points de données. La régression est utilisée dans des applications telles que la prévision de charge d'électricité et le trading algorithmique.

Les algorithmes couramment utilisés pour effectuer une régression incluent notamment le modèle linéaire, le modèle non linéaire, la régularisation, la régression pas à pas, le boosting/bagging d'arbres de décision, les réseaux de neurones et l'apprentissage neuro-flou adaptatif.


Clustering

Identifiez les groupements et les modèles naturels dans les données. Le clustering est utilisé sur des données sans étiquette pour identifier les groupements et les modèles naturels. Il est utilisé dans des applications telles que l'extraction de modèles, l'imagerie médicale et la reconnaissance d'objets.

Les algorithmes couramment utilisés pour le clustering incluent la méthode des k-moyennes et k-médoïdes, le clustering hiérarchique, les modèles de mélanges gaussiens, les modèles de Markov cachés, les cartes auto-organisatrices, le clustering c-moyennes flou et le clustering soustractif.

Communauté d'utilisateurs du Machine Learning

Découvrez et partagez des exemples ou des boîtes à outils générés par des utilisateurs, et accédez à MATLAB Answers pour trouver des réponses à vos questions.