Ce document n'est pas un cours ou un document de référence sur l'analyse multivariables, mais plutôt un document d'initiation. Les thèmes sont nombreux mais volontairement abordés superficiellement. 1000 excuses pour les omissions, imperfections voire erreurs qu'il contient (pour les erreurs, merci quand-même de me prévenir ...)

On pourra préalablement consulter le document "Mesure et étalonnage"

Généralités:
L’analyse multivariable est un outil mathématique très utilisé, notamment en instrumentation. Cet outil a d’abord été développé pour la chimiométrie (analyse chimique par l’exploitation de spectres) mais est utilisable (et de plus en plus utilisé) d’une façon générale lorsque de nombreuse variables disponibles doivent être traitées (systèmes multicapteurs par exemple).

L’analyse multivariables consiste à modéliser les variations d’un certain nombre de ces variables, que nous appellerons yi = (Y) dont l’obtention est délicate (nécessitant une analyse chimique par exemple) en fonction d’autres variables appelées xi = (X) " faciles " (mesure de capteurs physiques par exemple) afin de pouvoir se passer ultérieurement de la mesure des premières.

On distingue 2 opérations:


Problême de l’analyse multivariable:
Soient l échantillons dits d'étalonnage, chacun ayant c variables y (appelées par la suite Yvariables) caractéristiques, non " facilement " mesurables directement (ex: concentrations chimiques), mais quand-même supposées connues pendant la phase d'étalonnage:

Par contre, n variables x ("Xvariables") sont " facilement " mesurables (ex: grandeurs physiques):

Est-il possible, à partir de ces échantillons d'étalonnage, de trouver une fonction F telle que pour tout autre échantillon on puisse calculer, à partir de X;

Y = F(X) où F est appelé prédicteur ?

OUI!, à condition de pouvoir faire des hypothèses qualitatives sur F (forme générale), ce qui suppose donc:

BUTS:
  1. Connaissance quantitative de F (notamment constantes) et donc du phénomène étudié.
  2. Possibilité de pouvoir prédire ultérieurement les variables Y à partir des seules X.
Exemples:

Exemple 1 (trivial!): Mesure de la caractéristique d'une pile électrique

Exemple 2: Dessommation de pics d'analyse thermique (thermodésorption, thermoluminescence...)

Exemple 3: Loi d'absorption de la lumière dite de Beer-Lambert

* Point commun à toutes les méthodes:
Rechercher par modélisation (méthodes algébriques ou itératives) une relation mathématique reproduisant "au mieux" les variations de Y en fonction de X.


Méthode générale:
On désire trouver Y=F(X) le "plus précisément possible". On aura donc, pour les échantillons d'étalonnage:

Y=F(X)+E
où E est la matrice d'erreur sur les variables Y que l'on désire minimiser:

Le concept de minimisation d'une matrice nécessite d'introduire une distance. On utilise généralement la distance Euclidienne:

(D'où le nom de méthode des "moindres carrés"; en fait, d'autres types de distances pourraient faire l'affaire, mais alors le cas linéaire n'aurait pas de solution analytique simple)

Supposons, pour simplifier la formulation qu'il n'y ait qu'une variable y.
La forme générale des fonctions f est supposée connue. On doit donc trouver les constantes a1,...,aq,...,ap qui les caractérisent quantitativement, et donc telles que:

Donc, pour tout q,  = 0

Soit, pour tout q, 

On obtient donc p équations à p inconnues dont la résolution littérale est impossible dans le cas général.

Un cas particulier très important est le cas où la fonction F est linéaire.