Analyse par régression linéaire et mise au point d’expériences basées sur du matériel expérimental

Describe mathematical relationships and make predictions from experimental data

Une régression linéaire est une méthode statistique permettant de modéliser une relation entre une variable scalaire dépendante \(Y\) et une ou plusieurs variables explicatives notées \(X\). Ces techniques sont utilisées pour créer un modèle linéaire. Le modèle décrit la relation entre une variable dépendante \(y\) (également appelé la réponse) en fonction d’une ou plusieurs variables indépendantes \(Xi\) (appelé prédicteurs).

Il existe plusieurs types de modèles :

  • Simple : modèle à un facteur prédictif
  • Multiple : modèle avec plusieurs facteurs prédictifs
  • Multivariée : modèle expliquant plusieurs variables réponses

Simple linear regression example showing how to predict the number of fatal traffic accidents in a state (response variable, \(Y\)) compared to the population of the state (predictor variable, \(X\).). (See MATLAB® code example and how to use the mldivide operator to estimate the coefficients for a simple linear regression.)

Cette méthode peut vous aider à comprendre et prédire le comportement de systèmes complexes ou bien à analyser des données expérimentales, financières ou biologiques.

La fonction qui relie les variables explicatives à la variable expliquée est supposée linéaire dans ses paramètres. Le modèle s’écrit de la façon suivante pour un échantillon de taille \(N\) :

$$Y=\sum_{i}\beta_{i}X_{i}+ε_{i}, 1\lt i \lt N $$

avec \(ε_{i}\) l’erreur ou la perturbation, \(Y\) la variable réponse, \(X_{i}\) les variables prédictrices, et \(\beta\) les paramétres du modèle.

Plusieurs méthodes peuvent être utilisées pour l’estimation des paramètres :

Multiple linear regression example, which predicts the miles per gallon (MPG) of different cars (response variable, \(Y\)) based on weight and horsepower (predictor variables, \(X_j\)). (See MATLAB code example, how to use the regress function and determine significance of the multiple linear regression relationship.)

Multivariate linear regression: models for multiple response variables. This regression has multiple \(Y_i\)derived from the same data \(Y\). They are expressed in different formulae. An example of this system with 2 equations is:

\[Y_1 = \beta_{01} + \beta_{11} X_1 + \epsilon_1\]

\[Y_2 = \beta_{02} + \beta_{1 2}X_1 + \epsilon_2\]

Multivariate linear regression example showing how to predict the flu estimates for 9 regions (response variables, \(Y_i\)), based on the week of the year (predictor variable, \(X\)). (See MATLAB code example and how to use the mvregress function to determine the estimated coefficients for a multivariate linear regression.)

Multivariate multiple linear regression: models using multiple predictors for multiple response variables. This regression has multiple \(X_i\) to predict multiple responses \(Y_i\). A generalization of the equations is:

Multivariate multiple linear regression example that calculates the city and highway MPG (as response variables, \(Y_1\) and \(Y_2\)) from three variables: wheel base, curb weight, and fuel type (predictor variables, \(X_1\), \(X_2\) and \(X_3\)). (See MATLAB code example and how to use the mvregress function to estimate the coefficients.).

Applications of linear regression

Linear regressions have some properties that make them very interesting for the following applications :

  • Prediction or forecasting – Use a regression model to build a forecast model for a specific data set. From the mode, you can use regression to predict response values where only the predictors are known.
  • Strength of the regression – Use a regression model to determine if there is a relationship between a variable and a predictor, and how strong this relationship is.

Linear regression with MATLAB

Engineers commonly create simple linear regression models with MATLAB. For multiple and multivariate linear regression, you can use the Statistics and Machine Learning Toolbox™ from MATLAB. It enables stepwise, robust, and multivariate regression to:

  • Generate predictions
  • Compare linear model fits
  • Plot residuals
  • Evaluate goodness-of-fit
  • Detect outliers

To create a linear model that fits curves and surfaces to your data, see Curve Fitting Toolbox™.

  • La méthode des moindres carrés
  • La méthode robuste (robust fit)
  • L’ajustement par étape (stepwise fit)

MATLAB® et ses outils vous permettent de mettre en œuvre rapidement et de manière efficace ces algorithmes. Ils s’appliquent à la résolution de modèles linéaires issus de domaines d’applications divers (Finance, Biotechnologies, Pharmaceutique …) :

  • MATLAB inclut un opérateur de résolution de systèmes linéaires.
  • La Statistics and Machine Learning Toolbox™ met à votre disposition des fonctions permettant de gérer les points aberrants, les données corrélées, l’étude des résidus et la prédiction.
  • La Curve Fitting Toolbox™ offre des outils visuels facilitant l’adaptation de courbes ou de surfaces avec des modèles linéaires ou non linéaires.