Probability is about uncertainty, not randomness
Le problème des fondements
Le problème des rapports entre
probabilités et statistique renvoie au problème
éternel (épistémologique ou métaphysique?)
des fondements de la probabilité (mesure de l'incertitude). D'où
proviennent les probabilités?
On oppose couramment les deux conceptions:
fréquentiste et épistémique. Selon la
conception fréquentiste,
les seules probabilités fiables, réputées
"objectives", sont "dans les choses", et accessibles
seulement à partir des fréquences
observées lors d'événements
répétés. Le fréquentisme radical (Neyman-Pearson) ne connaît que cette sorte de probabilité. Selon la conception épistémique, ou bayésienne,
les probabilités sont "dans la tête", et
le concept de probabilité s'applique tout aussi bien aux
événements uniques, tels que les hypothèses en jeu
dans une recherche particulière.
Ces deux conceptions de la probabilité sont respectivement à la base des deux cadres d'inférence statistique: fréquentiste et bayésien, avec diverses variantes. Le fréquentisme radical,
(Neyman-Pearson) qui interdit la probabilité des
hypothèses, a à coup sûr vidé la
tête! La
conception bayésienne est assurément une
conception de la probabilité plus "réfléchie"- (selon le
mot de Guilbaud) ; mais les
bayésiens, en insistant sur le côté "subjectiviste", n'ont
guère aidé les chercheurs - férus
d'objectivité - à surmonter leurs réticences
à l'égard du "subjectif" (confondu
avec arbitraire).
En réalité, l'opposition
fréquentiste-épistémique n'épuise pas
le problème des fondements
des probabilités: voir Suppes (2002), en
particulier la discussion du fréquentisme (p. 183) et des
pratiques statistiques (p. 263).
Critique du
fréquentisme radical
La démarche inductive, si naturelle pour un chercheur, va à l'encontre du
fréquentisme radical
(Neyman-Pearson), l'actuelle doxa de la statistique
académique, qui en fait de probabilités, ne connaît que les probabilités
"fréquentistes", c'est-à-dire des fréquences "in
the long run". La statistique
devient "la science des hasards", avec un
modèle aléatoire posé au départ,
censé représenter le processus ayant engendré les
données. Les paramètres du modèle sont
regardés comme des "quantités fixes mais inconnues", sur
lesquelles aucun énoncé probabiliste n'est possible: un comble pour une
"science des hasards" ! Le random
sampling est l'alpha et l'oméga de la doctrine: hors de
l'échantillonnage aléatoire, point de salut! C'est bien la "sample-minded
approach"! Les
données ne sont pas là pour être
analysées d'abord par les procédures descriptives; elles
ne servent qu'à estimer et
tester les paramètres du modèle. Quant aux hypothèses
techniques, l'idéologie fréquentiste leur donne une place
démesurée, comme dans le "general linear
model", avec son formidable attirail d'"assumptions" souvent
gratuites et/ou invérifiables (e.g. multinormalité); ce
qui met continuellement en doute la validité des conclusions...
Portée pratique de la contestation du fréquentisme radical
Dans les milieux de la statistique académique, les contraintes du fréquentisme radical sont
aujourd'hui couramment admises; mais leur portée pratique est largement sous-estimée; naguère encore, dans l'argumentaire bayésien, on pouvait lire: "Most of modern statistics is perfectly sound in practice ; it is done for the wrong reason."
Non, les pratiques courantes sont loin d'être "perfectly sound"; au bas mot, elles pourraient être grandement améliorées en se débarrassant d'une idéologie débilitante. L'idéologie
fréquentiste détourne des analyses descriptives; elle donne une place démesurée aux
hypothèses techniques; enfin elle exclut toute probabilité
des hypothèses d'intérêt. En somme, elle bloque toute analyse inductive des données: cf. notre Dialogue
"sur les grands systèmes de la statistique", le khi-deux; les commentaires de Guttman sur l'affaire Burt; sans parler de la récente mise en cause dans les médias de la recherche médicale.
Référence
Suppes P. (2002). Representation and invariance of of scientific structures, CSLI, Stanford .
Retour à la
Troisième idée-force: la démarche inductive
|