Modélisation PLS

Nous n'expliquerons que très schématiquement l'algorithme pour 1 seul composant (PLS1). Pour une explication plus complète ou pour l'algorithme avec plusieurs composants (PLS2), on se reportera à la littérature .

A0 et C0 sont les valeurs initiales d'absorbance et de concentrationcentrées et normées.

(1): Rechercher, en régressant A0 sur C0, la composante de A la plus corrélée avec les variations de concentration: (on fait alors une CLS).

A0 = C0W1 + E
W1 qui est la première composante de la matrice de changement de base W. C'est l'opérateur "projecteur moyen" de A0 sur C0 (et qui ne projettera donc probablement pas parfaitement chaque composante de A0 sur C0)
W1 = (C'0C0)-1C'0A0
W1C0 est donc la projection de A0 sur C0 dans l'espace des échantillons.
W1 est alors normalisée: On a alors W1W'1 = Id

(2): Rechercher le "score" (projeté) correspondant à ce "projecteur moyen" en régressant A0 sur W1:

A0 = T1W1 +E
donc T1 = A0W'1(W1W'1)-1 = A0W1

(3): Rechercher en regressant C0 sur T1 la composante du prédicteur V1 correspondant à ce facteur:
(On fait alors une ILS).

C = T1v1 + E (1 compo --> v1 scalaire)
Donc v1 = (T'1T1)-1T'1C

(4): Calculer l'opérateur "projecteur inverse" P1 permettant de calculer la partie de A0 utilisée pour générer T1:

A0 = T1P1 + E
Donc P1 = (T1'T1)-1T1'A0

(5): Calculer les résidus d'absorbance et de concentration (information non utilisée, orthogonale à la précédente) en retranchant l'information déjà modélisée:

A1 = A0 - T1P1
C1 = C0 - T1v1

(6): Reprendre en (1) avec ces nouvelles valeurs et continuer à construire W et V jusqu'à atteindre le nombre de facteurs souhaité.
 

Il s'agit donc d'une méthode itérative (1 itération par facteur), pour chaque itération, l'information utilisée pour construire le modèle (info A ou C) est retranchée pour l'itération suivante.

Apres les n itérations, l'information (A ou C) restante est appélée résidu (d'absorbance ou de concentration).

Prédiction PLS
Retour