Fondements des  probabilités
(ce sous-module s'adresse  à  ceux qui ont fait
de la "statistique mathématique")

Probability is about uncertainty, not randomness

Le problème des fondements

Le problème des rapports entre probabilités et statistique renvoie au problème éternel (épistémologique ou métaphysique?) des fondements  de la probabilité (mesure de l'incertitude). D'où proviennent  les probabilités? On oppose couramment les deux  conceptions:  fréquentiste et épistémique. Selon la conception  fréquentiste,  les seules probabilités fiables, réputées "objectives", sont  "dans les choses", et accessibles  seulement  à partir des fréquences observées lors d'événements répétés. Le fréquentisme radical (Neyman-Pearson) ne connaît que cette sorte de  probabilité. Selon la conception  épistémique, ou bayésienne, les probabilités  sont "dans la tête",  et le concept de probabilité s'applique tout aussi bien aux événements uniques, tels que les hypothèses en jeu dans une recherche particulière.
Ces deux conceptions de la probabilité sont respectivement  à la base des  deux  cadres d'inférence statistique: fréquentiste et bayésien, avec diverses variantes. Le fréquentisme radical, (Neyman-Pearson) qui interdit   la probabilité des hypothèses,  a à coup sûr  vidé la tête!  La conception bayésienne est  assurément une conception de la probabilité plus "réfléchie"-  (selon le  mot de Guilbaud)  ; mais  les bayésiens, en insistant sur le côté "subjectiviste", n'ont guère  aidé les chercheurs - férus d'objectivité - à surmonter leurs  réticences à l'égard du  "subjectif" (confondu avec arbitraire).
En réalité, l'opposition fréquentiste-épistémique n'épuise pas  le problème des fondements  des  probabilités:   voir  Suppes (2002), en particulier  la discussion du fréquentisme (p. 183) et des pratiques statistiques (p. 263). 

Critique du fréquentisme radical
  La démarche inductive, si naturelle pour un chercheur,  va à l'encontre du  fréquentisme
radical  (Neyman-Pearson), l'actuelle doxa de la statistique académique, qui en fait de probabilités, ne connaît que les  probabilités "fréquentistes", c'est-à-dire des fréquences "in the long run". La statistique devient  "la science des hasards", avec un modèle aléatoire  posé au départ, censé représenter le processus ayant engendré les données. Les paramètres du modèle sont regardés comme des "quantités fixes mais inconnues", sur lesquelles aucun énoncé probabiliste n'est possible:  un comble pour une "science des hasards" !  Le random sampling est l'alpha et l'oméga de la doctrine: hors de l'échantillonnage aléatoire, point de salut! C'est bien  la "sample-minded approach"! Les données  ne  sont pas là pour être analysées d'abord par les procédures descriptives; elles ne servent qu'à  estimer et tester  les paramètres du modèle.    Quant aux   hypothèses techniques, l'idéologie fréquentiste leur donne une place démesurée, comme dans le  "general linear model",  avec son formidable attirail d'"assumptions" souvent gratuites et/ou invérifiables (e.g. multinormalité); ce qui met continuellement en doute la validité des conclusions...

Portée pratique de la contestation  du fréquentisme radical 

Dans les milieux de la statistique académique, les contraintes du fréquentisme radical sont aujourd'hui couramment  admises; mais leur  portée pratique  est largement sous-estimée; naguère encore,  dans l'argumentaire bayésien, on pouvait lire: "Most of modern statistics is perfectly sound in  practice ;  it is done for the wrong reason."
Non, les pratiques courantes sont loin d'être "perfectly sound";  au bas mot, elles pourraient être grandement améliorées en se débarrassant 
d'une idéologie débilitante. L'idéologie fréquentiste détourne des analyses descriptives; elle donne une place démesurée aux  hypothèses techniques;  enfin elle exclut toute probabilité des  hypothèses d'intérêt. En somme, elle bloque toute analyse inductive des données:  cf. notre Dialogue  "sur les grands systèmes de la statistique", le khi-deux; les  commentaires de Guttman  sur l'affaire Burt; sans parler de la récente mise en cause dans les médias  de la recherche médicale.

Référence
Suppes P. (2002). Representation and invariance of of scientific structures, CSLI, Stanford .

Retour à la Troisième idée-force: la démarche inductive

Retour à la PAGE D'ACCUEIL
Début de page