IDEES-FORCES: NOTES COMPLEMENTAIRES
(s'adresse aux statisticiens professionnels)

Formalisation linéaire vs approche matricielle

L'approche matricielle actuellement dominante en statistique  ignore l'algèbre linéaire   l'algèbre linéaire "abstraite",  et se fonde exclusivement sur les manipulations matricielles pour caractériser et étudier les procédures statistiques.  Malheureusement, le calcul matriciel tel qu'il est  pratiqué en statistique  n'est pas assez puissant pour prendre en compte toutes les structures pertinentes,  ce qui rend les démonstrations  absconses voire  imparfaites, même dans les sentiers les plus battus de la statistique : voir  Régression. En Analyse Géométrique des Données,  la "traduction matricielle"  de l'algorithme de l'Analyse des Correspondances  a abouti à  la dégradation de la méthode.  Voir  "Critique du calcul matriciel" in Benzécri  & al (1973, p.58) ; et  Le Roux & Rouanet  (2004, p. 9 et 449).
Ecoutons maintenant  Dieudonné (1964), prince des  mathématiques:  "Il n'y a sans doute pas de théorie plus universellement utilisée en Mathématique que l'Algèbre linéaire; il n'y en a presque pas non plus qui soit plus élémentaire, bien que des générations de professeurs  et de faiseurs de manuels  se soient ingéniés à la compliquer à plaisir par de ridicules calculs de matrices... On peut bien entendu traduire dans le langage des matrices la plupart des résultats énoncés précédemment   pour les applications linéaires;  il y a presque toujours avantage, en pratique, lorsqu'il s'agit d'un problème de calcul  de matrices, à revenir à leur interprétation par des applications linéaires,  beaucoup plus souple et commode." L'algèbre linéaire fait toujours partie,  du moins en France, des  mathématiques élémentaires enseignées à l'université. Mais la  statistique  "mathématique"  ignore les avantages qu'elle pourrait  tirer de cet enseignement et reproduit la doxa matricielle.   
Critique de l'approche  matricielle

On  m'invite parfois à '"apporter des preuves" de la lourdeur de l'approche matricielle.
Voici donc comment, dans le cadre du "general linear model", le plan d'expérience "sujets emboîtés dans le croisement de deux facteurs" est noté  dans Kendall & Stuart, la "bible de la statistique académique".





Dans la notation ensembliste (et nos logiciels),  ce plan est noté S<A*B>.
La notation matricielle  des plans plus complexes (e.g. "sujets emboîtés dans le croisement de deux facteurs et croisés avec deux autres facteurs" S<A*B>*C*D) est laissée au lecteur.

Début de page