Main Content

La traduction de cette page n'est pas à jour. Cliquez ici pour voir la dernière version en anglais.

Prétraitement des données

Nettoyer, lisser et regrouper les données

Les données peuvent nécessiter certaines techniques de prétraitement pour garantir une analyse précise, efficace ou significative. Le nettoyage des données comprend des méthodes permettant de rechercher, supprimer et remplacer des données incorrectes ou manquantes. La détection des valeurs extrêmes locales et des changements soudains facilite l’identification des tendances importantes. Les processus de lissage et d’élimination des tendances permettent de supprimer le bruit et les tendances polynomiales des données. La mise à l’échelle modifie les limites des données. Les méthodes de regroupement permettent d’identifier les caractéristiques des données par groupes.

Applications

Data CleanerPreprocess and organize column-oriented data (depuis R2022a)

Tâches du Live Editor

Clean Missing DataFind, fill, or remove missing data in the Live Editor (depuis R2019b)
Clean Outlier DataFind, fill, or remove outliers in the Live Editor (depuis R2019b)
Compute by GroupSummarize, transform, or filter by group in the Live Editor (depuis R2021b)
Find Change PointsFind abrupt changes in data in the Live Editor (depuis R2019b)
Find Local ExtremaFind local maxima and minima in the Live Editor (depuis R2019b)
Normalize DataCenter and scale data in the Live Editor (depuis R2021b)
Smooth DataSmooth noisy data in the Live Editor (depuis R2019b)
Find and Remove TrendsFind and remove polynomial or periodic trends from data in the Live Editor (depuis R2019b)

Fonctions

développer tout

anymissingDetermine if any array element is missing (depuis R2022a)
ismissingFind missing values
rmmissingRemove missing entries
fillmissingFill missing entries
fillmissing2Fill missing entries in 2-D data (depuis R2023a)
missingCreate missing values
standardizeMissingInsert standard missing values
isoutlierFind outliers in data
filloutliersDetect and replace outliers in data
rmoutliersDetect and remove outliers in data
movmadMoving median absolute deviation
ischangeFind abrupt changes in data
islocalminFind local minima
islocalmaxFind local maxima
smoothdataSmooth noisy data
movmeanMoving mean
movmedianMoving median
detrendRemove polynomial trend
trenddecompFind trends in data (depuis R2021b)
normalizeNormalize data
rescaleScale range of array elements
discretizeGroup data into bins or categories
pivotSummarize tabular data in pivoted table (depuis R2023a)
groupsummaryGroup summary computations
groupcountsNumber of group elements (depuis R2019a)
groupfilterFilter by group (depuis R2019b)
grouptransformTransform by group
histcountsHistogram bin counts
histcounts2Bivariate histogram bin counts
findgroupsFind groups and return group numbers
splitapplySplit data into groups and apply function
rowfunApply function to table or timetable rows
varfunApply function to table or timetable variables
accumarrayAccumulate vector elements

Rubriques