L'analyse des séries temporelles est une technique statistique utilisée pour analyser des points de données enregistrés à intervalles de temps réguliers. Elle peut contribuer à identifier des motifs, des tendances et des variations saisonnières, ce qui le rend utile pour prévoir des résultats au fil du temps.
Les ingénieurs et les scientifiques travaillant avec des données de séries temporelles peuvent exploiter l'analyse des séries temporelles pour surveiller, modéliser et prédire les comportements des systèmes, ce qui permet d'optimiser ces systèmes et d'améliorer la précision des prévisions.
Principes de l'analyse des séries temporelles
L'analyse des séries temporelles consiste à travailler sur des séries temporelles en vue de les analyser de manière systématique. Les séries temporelles sont constituées d'une séquence de points de données collectés ou enregistrés à des moments précis dans le temps, de sorte que chaque point de données est associé à un horodatage particulier permettant d'analyser la manière dont les données évoluent dans le temps.
Composantes des données de séries temporelles
Il est possible de séparer les différentes composantes fondamentales des données de séries temporelles pour mieux comprendre les motifs sous-jacents et établir des prévisions.
Composante | Définition | Exemple | |
![]() |
Tendance | Orientation générale des données dans le temps (par exemple : en hausse, en baisse ou stables) | Adoption des véhicules électriques, revenus d'une startup |
![]() |
Saisonnalité | Motifs de données présentant des répétitions sur un ensemble de périodes de temps (par exemple : quotidiennes, mensuelles ou annuelles) | Demande d'électricité culminant pendant les mois d'été |
![]() |
Variations cycliques | Motifs répétitifs mais non saisonniers observés sur plusieurs années dans les données | Cycles du marché immobilier |
![]() |
Variations irrégulières | Hausses et baisses imprévisibles, qui ne peuvent pas être expliquées par d'autres composantes | Crash boursier soudain dû à des événements imprévus |
Étapes de l'analyse des séries temporelles
L'analyse des séries temporelles fait intervenir une approche systématique intégrant diverses techniques visant à comprendre, modéliser et prévoir les points de données collectés au fil du temps.
Analyse exploratoire des données
L'analyse exploratoire des données (AED) consiste à collecter des données brutes, puis à les prétraiter et à les visualiser en vue d'une analyse plus approfondie. Elle inclut les éléments suivants :
- Collecte des données : collecte d'observations sur une période donnée, en veillant à la qualité et à la précision du jeu de données.
- Prétraitement et visualisation des données : caractérisation et préparation du jeu de données pour l'analyse et la modélisation. Le prétraitement des données comprend le nettoyage des données, leur transformation ainsi que des opérations structurelles.
Décomposition
La décomposition est une technique utilisée pour séparer les différentes composantes fondamentales des données de séries temporelles (tendances, variations saisonnières, variations cycliques et variations irrégulières résiduelles), ce qui facilite l'analyse des motifs sous-jacents et l'interprétation des données.
![Tracé d'une analyse de séries temporelles montrant la courbe des données, ainsi que quatre autres courbes correspondant chacune à une composante issue de la décomposition.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_2113015877/51228219-8e9c-4d90-a9dc-8042b6ca1b66/image.adapt.full.medium.png/1738167836161.png)
Décomposition d'un jeu de séries temporelles en tendances à long terme, variations saisonnières et variations résiduelles, grâce à l'algorithme d'analyse du spectre singulier implémenté via la fonction trenddecomp
. (Voir le code MATLAB.)
Sélection et ajustement du modèle
La sélection du modèle permet de trouver le modèle le mieux adapté pour capturer les motifs de données sous-jacents en fonction de caractéristiques telles que la saisonnalité, la tendance et la stationnarité. L'ajustement du modèle met l'accent sur l'entraînement du modèle sélectionné en vue de minimiser la différence entre les données observées et les prédictions, tout en s'assurant qu'il se généralise bien à de nouvelles données.
Prédiction et prévision par le modèle
Dans la phase de prédiction et de prévision, le modèle entraîné à l'étape précédente est appliqué à des données nouvelles pour générer des points de données futurs en fonction des motifs historiques.
Évaluation du modèle
L'évaluation du modèle consiste à déterminer ses performances et la précision de ses prédictions. Cela comprend trois éléments clés :
- Métriques de performance : des métriques telles que la racine de l'erreur quadratique moyenne (RMSE) évaluent les différences entre valeurs prédites et valeurs réelles, ce qui fournit une mesure de la précision du modèle.
- Techniques de validation : la validation croisée, le backtesting et d'autres techniques estiment la fiabilité d'un modèle en évaluant sa performance lorsqu'il doit effectuer des prédictions sur de nouveaux jeux de données.
- Méthodes d'interprétabilité : des techniques comme les méthodes LIME (local interpretable model-agnostic explanations) ou SHAP (Shapley additive explanations) aident à comprendre les prédictions du modèle, rendant ainsi ses décisions plus transparentes.
![Histogramme utilisé pour l'analyse des séries temporelles, affichant la distribution des valeurs RMSE, avec une mise en évidence des séquences anormales et une base de référence à des fins de comparaison.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_1877876223/6de26e5d-6752-43ac-ba63-30f9941aaae8/image.adapt.full.medium.png/1738167836222.png)
Visualisation de la distribution des valeurs RMSE pour les données nouvelles pour identifier les séquences anormales. (Voir le code MATLAB.)
![Carte de couleurs illustrant l'utilisation de la méthode LIME pour interpréter la décision de classification d'un réseau de neurones profond.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_1877876223/fa5291a2-2d17-4501-a6b9-3a4c0187578d/image.adapt.full.medium.png/1738167836239.png)
Visualisation des prédictions du réseau avec la fonction imageLIME
. (Voir le code MATLAB.)
Approches courantes en matière de modélisation de séries temporelles
Les modèles de prévision traditionnels, les modèles de Machine Learning et les modèles de Deep Learning, sont trois approches couramment utilisées en matière de modélisation des données de séries temporelles.
Modèles de prévision traditionnels
Les modèles de prévision traditionnels utilisent des techniques statistiques pour identifier et modéliser les tendances et motifs sous-jacents aux données.
Le modèle statistique ARIMA (auto regressive integrated moving average) prédit les valeurs futures en analysant les données historiques. Il rend compte des tendances et de la saisonnalité, ce qui le rend applicable aux jeux de données aussi bien stationnaires que non stationnaires, et adapté aux prévisions à court et à moyen terme comme les cours boursiers et les ventes.
![Tracé 2D comparant les prédictions avec cinq étapes d'avance d'un modèle ARIMA, le pourcentage de correspondance de 78,76 % traduisant les performances du modèle par rapport aux données de validation.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_1095866753/44ade517-18ee-408b-86d5-eb35e900e704/image.adapt.full.medium.png/1738167836328.png)
Estimation d'un modèle ARIMA avec System Identification Toolbox pour la prévision des séries temporelles. (Voir le code MATLAB.)
Le modèle de lissage exponentiel applique des pondérations exponentiellement décroissantes aux observations passées, en donnant la priorité aux données les plus récentes. Cette méthode permet de lisser efficacement les fluctuations à court terme tout en capturant les tendances et les motifs sous-jacents aux données des séries temporelles. Elle est particulièrement utile pour les données présentant des tendances ou une certaine saisonnalité.
Modèles de Machine Learning
Les modèles de Machine Learning peuvent identifier dans des données des motifs complexes susceptibles d'être ignorés par les modèles traditionnels.
Les modèles de forêt d’arbres décisionnels aléatoires construisent plusieurs arbres de décision et combinent leurs sorties pour améliorer la précision des prédictions dans l'analyse des séries temporelles. Ils gèrent des jeux de données volumineux, de grande dimension et sont robustes vis-à-vis du surajustement. Utiliser des données passées comme prédicteurs leur permet de capturer les relations et les interactions non linéaires, ce qui les rend bien adaptés à la modélisation de motifs irréguliers.
Les machines à vecteurs de support (SVM) sont des modèles d'apprentissage supervisés utilisés pour la classification et la régression. Dans l'analyse des séries temporelles, ils peuvent modéliser des relations non linéaires et traiter des données présentant une dimensionalité élevée, en particulier avec des jeux de données complexes et de petite taille. Par exemple, les SVM peuvent prévoir la demande d'énergie en identifiant les interactions non linéaires entre la consommation historique, les conditions météorologiques et les indicateurs économiques.
![Quatre tracés 2D d'une analyse des séries temporelles sur des données ECG, montrant différentes conditions cardiaques (ARR, CHF et NSR).](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_1057052550/13ba3d09-7abe-4e08-a861-852c32676289/image.adapt.full.medium.png/1738167836399.png)
Tracé montrant la classification de signaux ECG par traitement du signal, extraction de caractéristiques basées sur les ondelettes et utilisation d'un classificateur à SVM (machine à vecteurs de support) pour distinguer l'arythmie (ARR), l'insuffisance cardiaque congestive (CHF) et le rythme sinusal normal (NSR). (Voir le code MATLAB.)
Modèles de Deep Learning
Le Deep Learning améliore l'analyse des séries temporelles en apprenant automatiquement les motifs et dépendances directement à partir des données. Ces modèles saisissent à la fois les fluctuations à court terme et les tendances à long terme, ce qui les rend idéaux pour la prévision et la détection des anomalies.
Les modèles LSTM (Long Short-Term Memory) correspondent à un type spécialisé de réseau de neurones récurrents (RNN), conçu pour surmonter les limitations des RNN traditionnels en utilisant des cellules mémoires et des mécanismes de portes. Ce design leur permet de saisir efficacement les dépendances à long terme, ce qui rend les LSTM particulièrement utiles pour les tâches d'analyse des séries temporelles telles que la prévision et la prédiction de séquences.
![Tracé 2D d'une analyse des séries temporelles montrant quatre cycles de données d'entrée et cinq cycles additionnels obtenus par prévision.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_2118520215/a344761c-6d6c-4fdb-8b64-f5a6c1f4d5a7/image_1634535254.adapt.full.medium.png/1738167836442.png)
Utilisation d'un réseau LSTM (Long Short-Term Memory) pour la prédiction en boucle fermée de séries temporelles. (Voir le code MATLAB.)
Les réseaux de neurones à convolution (CNN) sont utilisés dans l'analyse des séries temporelles car ils peuvent extraire automatiquement des caractéristiques à partir des données en utilisant des couches convolutives. Ils identifient des hiérarchies et motifs locaux, ce qui les rend efficaces pour identifier les dépendances à court terme dans le cadre de tâches telles que la classification de séries temporelles multivariées.
![Scalogramme montrant la représentation temps-fréquence utilisée pour l'analyse des séries temporelles appliquée à des signaux ECG humains.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_582677468/874d935e-e925-407f-9291-b93e8358d5fc/image.adapt.full.medium.png/1738167836508.png)
Classification de séries temporelles utilisant l'analyse par ondelettes et le Deep Learning. (Voir le code MATLAB.)
![Tracé 2D d'une analyse des séries temporelles montrant 12 caractéristiques sur plusieurs pas de temps.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_582677468/718e577f-ef0a-4055-a459-7aa5ca2c521f/image.adapt.full.medium.png/1738167836524.png)
Classification de séquences utilisant des convolutions 1D. (Voir le code MATLAB.)
Types d'analyse des séries temporelles
Les analyses des séries temporelles peuvent être classées en différentes catégories reflétant leur capacité à décrire, expliquer, prévoir ou optimiser efficacement les tendances et les motifs dans les données :
- L'analyse descriptive résume les principales caractéristiques d'un jeu de données. Elle permet de comprendre les motifs, tendances et variations saisonnières, sous-jacents dans les données.
- L'analyse explicative vise à comprendre les relations et les effets de causalité au sein des données. Elle cherche à expliquer pourquoi certains motifs ou tendances se manifestent en examinant les corrélations et facteurs sous-jacents.
- L'analyse prédictive utilise des données historiques, des modèles statistiques et des algorithmes de Machine Learning pour prédire les tendances et motifs futurs.
- L'analyse prescriptive fournit des recommandations et des actions basées sur des informations prédictives. Elle suggère des décisions optimales en évaluant différents scénarios et leurs résultats potentiels.
Défis liés à l'analyse des séries temporelles
L'analyse des séries temporelles se heurte typiquement à certains types d'obstacles. Lors de l'acquisition des données, il est fréquent que les capteurs ou les instruments enregistrent les données à intervalles irréguliers, ce qui s'avère problématique pour de nombreux modèles de séries temporelles conçus de façon à traiter des données à croissance monotone. La préparation des données peut inclure le traitement des données manquantes, des valeurs aberrantes, du bruit et d'autres irrégularités, ainsi que le rééchantillonnage des données afin de créer des intervalles uniformes. Les techniques d'analyse exploratoire des données évoquées ci-dessus peuvent contribuer à atténuer ces problèmes.
En outre, la saisonnalité et les motifs cycliques inhérents aux séries temporelles peuvent compliquer le processus de sélection et d'ajustement des modèles. Posséder une bonne compréhension du jeu de données et des options de modélisation applicables constitue un excellent point de départ. Les approches de modélisation décrites ici, ainsi que la validation croisée et d'autres techniques établies de vérification des modèles, seront utiles dans ces contextes.
Importance de l'analyse des séries temporelles
L'analyse des séries temporelles peut être utilisée pour modéliser et prédire les tendances futures dans divers domaines, tels que les cours de la bourse, les conditions météorologiques, les ventes et la prédiction de la demande. Cette approche améliore la précision de la planification et appuie la prise de décisions stratégiques en anticipant les développements à venir. Voici quelques exemples d'applications qui bénéficient de l'analyse des séries temporelles :
Analyse économique et financière : comprendre les indicateurs économiques et les marchés financiers en fournissant des informations pour la gestion des risques et la planification stratégique.
Surveillance de l'environnement : effectuer une surveillance continue de l'environnement et évaluer les risques climatiques, ce qui permet de comprendre les tendances et les risques à long terme.
Maintenance prédictive : anticiper les pannes des équipements et optimiser les plannings de maintenance pour réduire les temps d'arrêt et les coûts d'exploitation.
Traitement du signal : interpréter les signaux des dispositifs IoT, des capteurs et des systèmes de santé pour améliorer les performances, détecter les anomalies et augmenter la fiabilité.
Exemples d'analyse des séries temporelles
L'analyse des séries temporelles fait appel à des techniques permettant de comprendre et de prévoir des données qui évoluent au fil du temps. Les exemples ci-dessous illustrent diverses applications et mettent en évidence des méthodes et outils uniques, permettant d'extraire des informations pertinentes à partir de jeux de données complexes.
Analyse du tremblement de terre de Loma Prieta
Découvrez comment stocker des données sismiques horodatées dans des timetables et utilisez des fonctions timetable
pour analyser et visualiser l'accélération du sol sur un intervalle de temps spécifique afin de comprendre l'activité sismique.
![Visualisation d'une analyse de séries temporelles sur les données de vitesse et de position visant à comprendre l'activité sismique.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_831475414/eb9e694a-66e0-4207-a294-ce69c7f96d71/image.adapt.full.medium.png/1738167836691.png)
Série temporelle des composantes de l'accélération. (Voir le code MATLAB.)
Introduction pratique à l'analyse temps-fréquence
Découvrez comment effectuer et interpréter une analyse temps-fréquence de base pour analyser un signal non stationnaire tel que les tonalités DTMF (dual-tone multi-frequency).
![Spectrogramme montrant la fréquence et la puissance des tonalités DTMF.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_831475414/fa510ebb-b8ce-4f84-a149-a6ac46441e6f/image.adapt.full.medium.png/1738167836719.png)
Spectrogramme des tonalités DTMF composées pour le numéro 508, qui montre les durées et les séquences des tonalités, et met en évidence une tonalité de 1336 Hz pour l'entrée au clavier de la deuxième colonne. (Voir le code MATLAB.)
Prévoir des séries temporelles multivariées
Découvrez comment effectuer des prévisions de séries temporelles multivariées à partir de données mesurées sur des populations de prédateurs et de proies dans un scénario de surpopulation des proies.
![Graphique linéaire montrant les réponses prévues pour différents modèles.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_960282012/58f5f72b-32da-441d-b641-6fde4fc3b9bf/image.adapt.full.medium.png/1738167836786.png)
Analyse comparative des prévisions obtenues pour des populations de prédateurs et de proies en utilisant différents modèles : ARMA, AR polynomial, processus gaussien (GP) et boîte grise. (Voir le code MATLAB.)
Classifier des signaux ECG avec un LSTM
Découvrez comment classifier des données ECG en utilisant des réseaux LSTM et l'analyse temps-fréquence.
![Ensemble de deux graphiques linéaires montrant la fréquence instantanée de signaux ECG.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_960282012/9436f0ae-bd9e-4a2b-ab42-5af5993263d8/image.adapt.full.medium.png/1738167836815.png)
Comparaison de la fréquence instantanée pour un signal ECG normal et un signal de fibrillation auriculaire (AFib). (Voir le code MATLAB.)
Pour continuer à explorer ce sujet
Préparer les données pour l'analyse des séries temporelles avec des timetables
Si vous prévoyez d'utiliser des opérations temporelles, avant ou après les tâches de prétraitement telles que la gestion des valeurs manquantes et des valeurs aberrantes, vous devez convertir les données dans un format adapté à l'analyse des séries temporelles. La fonction timetable
est conçue pour les données horodatées, qui associent une heure à chaque ligne et stockent des variables orientées colonnes avec le même nombre de lignes. Elle simplifie l'analyse des séries temporelles en fournissant des fonctions spécifiques au temps permettant d'aligner, de combiner et de calculer les données, ainsi que des fonctions telles que la synchronisation et le rééchantillonnage.
![Tracé 2D montrant le décompte du trafic de vélos et la température extérieure sur deux axes y distincts.](https://fr.mathworks.com/discovery/time-series-analysis/_jcr_content/mainParsys/band_1857610351/mainParsys/lockedsubnav/mainParsys/columns/335ce30a-77fd-4c27-af75-93672733f56b/columns_673420312/27bf6009-9273-435f-9a06-4b671028cb61/image.adapt.full.medium.png/1738167837041.png)
Organisation et prétraitement de données de capteurs horodatées avec le conteneur de données timetable pour analyser les motifs dans le trafic cycliste. (Voir le code MATLAB.)
MATLAB propose des toolboxes spécialisées et adaptées à votre domaine d'application spécifique pour vous aider dans toutes les étapes de vos workflows.
Application | Étapes suivantes de l'analyse des séries temporelles | Toolbox et fonctionnalités clés | Exemples et ressources |
Statistiques et Machine Learning | Modéliser des séries temporelles en appliquant des modèles statistiques et des algorithmes de Machine Learning | Statistics and Machine Learning Toolbox™
|
Analyser des séries temporelles |
Prévisions économiques | Effectuer des modélisations et des analyses économétriques, notamment des prévisions de séries temporelles et des tests d'hypothèse |
|
Estimer du modèles ARIMA multiplicatif |
Modélisation de systèmes dynamiques | Créer, estimer et prévoir des modèles de séries temporelles | System Identification Toolbox™
|
Utiliser des données timetables pour l'identification du système dans le domaine temporel |
Surveillance de l'état et maintenance prédictive | Développer des algorithmes en analysant des données de capteurs pour prédire les pannes d'équipement et optimiser la maintenance | Predictive Maintenance Toolbox™
|
Analyser et sélectionner des caractéristiques pour le diagnostic sur des pompes |
Analyse du signal | Filtrer et analyser des signaux ; extraire les caractéristiques de séries temporelles |
|
Extraire les régions d'intérêt d'un chant de baleine |
Deep Learning | Utiliser des réseaux de neurones pour identifier des motifs complexes |
|
Prévision de séries temporelles avec le Deep Learning |
Ressources
Développez vos connaissances grâce à la documentation, aux exemples, aux vidéos et plus encore.
Version d'essai gratuite de 30 jours
CommencerSélectionner un site web
Choisissez un site web pour accéder au contenu traduit dans votre langue (lorsqu'il est disponible) et voir les événements et les offres locales. D’après votre position, nous vous recommandons de sélectionner la région suivante : United States.
Vous pouvez également sélectionner un site web dans la liste suivante :
Comment optimiser les performances du site
Pour optimiser les performances du site, sélectionnez la région Chine (en chinois ou en anglais). Les sites de MathWorks pour les autres pays ne sont pas optimisés pour les visites provenant de votre région.
Amériques
- América Latina (Español)
- Canada (English)
- United States (English)
Europe
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)