1.
Première idée-force : formelle - les piliers de la
formalisation - Note complémentaire sur la formalisation |
Far better an approximate answer to the right question ...
than an exact answer to the wrong one. J. Tukey TROISIEME IDEE-FORCE : DESCRIPTIVE-INDUCTIVE Visée inductive et inférence statistique Beaucoup de recherches comportent une visée inductive,
en ce sens que les conclusions souhaitées vont au
delà des conclusions descriptives. Avec des données de
petite taille, les inductions hâtives peuvent être
précaires; d'où l'intérêt des
procédures formelles de l'inférence statistique: depuis l'élémentaire test du khi-deux
jusqu'aux procédures sophistiquées aujourd'hui fournies
par l'ordinateur. Les chercheurs attendent de la statistique qu'elle
les éclaire non seulement sur la teneur, mais sur la
portée des conclusions qui se dégagent de leurs
données. Dans les publications scientifiques, l'usage des
procédures d'inférence est devenu quasiment la
norme. Il est bon toutefois de rappeler que les
sciences physiques et
naturelles, pour lesquelles la visée inductive est vitale,
n'ont pas attendu l'inférence statistique (dont la
diffusion date de moins d'un siècle) pour valider
leurs hypothèses. Il faut
s'élever contre le dogmatisme d'une
norme qui exige
l'inférence statistique pour la validation des
hypothèses; ainsi qu'on a pu le voir
imprimé sérieusement dans un quotidien: voir l'affaire Morneille". Tout comme il faut
s'élever contre le laxisme
de cette même norme, qui en guise de preuve se
contente souvent des procédures d'inférence
les plus frustes. Le star
system (* significant, **
highly significant), qui n'est ni
nécessaire ni suffisant pour l'administration de la "preuve par
la statistique", est un scandale, comme l'ont
répété à l'envi les meilleurs
méthodologistes, comme Guttman, qui fustigeait les "star
worshippers": Voir l'affaire Burt, et les aberrations de la recherche médicale. Au commencement d'une analyse statistique, le chercheur
dispose en général d'hypothèses
d'intérêt ("Il y a un effet de tel ou tel facteur") ou au
moins de questions d'intérêt ("Y a-t-il un effet de ce
facteur?") L'Analyse Inductive des Données s'inspire de la
philosophie d' Analyse des Données: "Dégager ce que
les données ont à dire": voilà la
première tâche de la statistique. Les
conclusions descriptives énoncées, l'objectif
de l'Analyse Inductive des Données est de chercher à
corroborer ces conclusions. A l'évidence, seules les
hypothèses d'intérêt qui ne vont pas à
l'encontre des conclusions descriptives peuvent prétendre
à être corroborées par les procédures
d'inférence. Par exemple, si un effet est descriptivement
négligeable, aucune procédure d'inférence ne saurait prouver
que cet effet est "en réalité" important. L'inférence statistique traditionnelle des chercheurs, autour du
test de signification d'absence d'effet, apporte une première réponse aux perspectives de l'analyse inductive des données. Lorsque le test d'absence d'effet d'un facteur est
pratiqué suite à la conclusion descriptive d'existence
d'un effet, il constitue un utile garde-fou,
en ce sens qu'un résultat statistiquement significatif
confirme l'existence de l'effet, et - pour
un effet unidimensionnel - le sens de l'effet; alors
qu'un résultat non-significatif laisse incertain sur le sens de
l'effet.
Malheureusement, les traités ne
s'étendent guère sur les solutions qu'il convient
d'adopter quand le problème est précisément de se
prononcer sur le caractère notable de l'effet étudié, ou à l'opposé sur son caractère négligeable. D'où pour les chercheurs la tentation permanente de la significance fallacy, consistant à prendre significatif pour notable, et non-significatif pour négligeable. Pour une discussion du fréquentisme radical de la statistique académique, voir Statistique et Probabilités. Voir aussi R.A. Fisher.
Note personnelle
De la doxa
fréquentiste à l'Analyse Inductive des Données
La troisième idée-force, conduisant à l'Analyse Inductive des Données, ne s'est dégagée que progressivement dans mes recherches. Elle a nécessité les travaux éclaircissant les rapports entre statistique descriptive et inférence statistique: voir Piliers de la formalisation, Statistique et Probabilités, Fondements des probabilités. En 1973, j'avais fait le tour de toutes les ressources du fréquentisme radical pour trouver des solutions pratiques palliant les insuffisances des méthodes traditionnelles. Dès lors je suis arrivé à la conviction que le fréquentisme radical était une impasse, en ce sens que les prétendues "erreurs des utilisateurs" n'étaient pas seulement des applications maladroites de la théorie, mais tenaient bel et bien à une idéologie déconnectée de la démarche du chercheur, qui bloquait toute stratégie inductive. Je savais par ailleurs que des approches de rechange au fréquentisme radical existaient: l'approche fiduciaire, l'approche bayésienne... Dans cette étape éprouvante de reconversion, où il s'agissait de me défaire d'une idéologie nuisible, j''ai été objectivement aidé par la fréquentation de G-Th Guilbaud, grand'maître de la combinatoire, et dont les vues sur les probabilités, de Pascal à de Finetti, étaient d'une tout autre ampleur que la doxa statistique régnante - Je ne dirai jamais assez ma dette à l'égard de Guilbaud (cf. Urbino). J'ai rencontré Michel Mouchart et son groupe bayésien du CORE à Louvain-la-Neuve. Grâce à mon ami Johnkheere, j'ai entamé des contacts réguliers avec le département de Statistique d'University College de Londres (un haut lieu de la statistique bayésienne), autour de Lindley, Philip Dawid et Mervin Stone, qui m'ont maintes fois invité à présenter mes travaux à leur séminaire... Dès lors j'ai travaillé au double élargissement des méthodes d'inférence traditionnelles, d'une part sur le versant combinatoire, d'autre part sur le versant bayésien. Les développements de la statistique intervenus depuis lors, d'une part le développement prodigieux des techniques combinatoires, d'autre part la révolution bayésienne actuellement en cours, sont venus conforter cette réorientation décisive, et assurer un environnement reconnu à mes recherches. Je tombe sur le passage suivant dans un texte récent de Reuchlin (2003, Vol 4) "Après avoir étudié et pratiqué un fréquentisme modéré (notamment avec J.M. Faverge), H. Rouanet s'était familiarisé avec le fréquentisme radical à Stanford University. Dans le courant des années 70, il prend conscience de l'inadaptation de ces méthodes aux besoins des chercheurs, et il évolue (notamment sous l'influence de G.Th. Guilbaud) vers un bayésianisme modéré, appliqué à la statistique pour les chercheurs." On ne saurait mieux résumer mon évolution de 1957 à 1973. |
Début de page |