Guide de démarrage du Machine Learning automatisé (AutoML) avec MATLAB
Pourquoi utiliser l'AutoML ?
L'apprentissage automatique (AutoML) vous permet d'automatiser les étapes difficiles et itératives du workflow de création de modèles sans nécessiter d'expertise en Machine Learning.
Limites à l'adoption du Machine Learning :
- Coût élevé de l'expertise requise
- Workflow itératif incrémental
- Optimisation manuelle impossible pour de nombreux modèles
Avantages de l'AutoML
- Les ingénieurs et les spécialistes domaine, même sans expertise particulière, peuvent créer de bons modèles.
- Les experts en Machine Learning gagnent du temps.
- Il est possible de développer des applications qui nécessitent de nombreux modèles optimisés.
1. Extraction de caractéristiques
2. Sélection de caractéristiques pertinentes
Analyse NCA (Neighborhood Component Analysis)
Identification d’un petit sous-ensemble de caractéristiques présentant un pouvoir prédictif élevé.
fscnca(data, labels, 'Lambda'); find(mdl.FeatureWeights > 0.2)
Également disponibles :
- Pertinence maximale et redondance minimale
- ReliefF
- Sélection pas à pas (stepwise)
3. Sélection de modèle
Identification du meilleur modèle en une seule étape :
- Pour la classification :
fitcauto(data, labels, 'Options', …) - Pour la régression :
fitrauto
Options
- Limiter le nombre d'itérations d'optimisation :
MaxObjectiveEvaluations - Activer l'exécution parallèle :
UseParallel - Enregistrer le modèle après chaque itération :
SaveIntermediateResults - Limiter les modèles et les hyperparamètres à prendre en compte :
Learners / OptimizeHyperparameters - Afficher les erreurs :
ShowPlots
Remarques :
- Trouver le meilleur modèle n’est pas garanti
- Résultats satisfaisants obtenus généralement au bout de 50 à 150 itérations