|
|||||
|
|||||
Projet personnel de recherche | |||||
|
|||||
Mes activités de recherche correspondent à trois directions relevant toutes de l'Analyse Géométrique des Données (AGD), c'est-à-dire les méthodes d'analyse de données multidimensionnelles euclidienne et à leurs applications. | |||||
1) Stabilité d'un nuage euclidien. | |||||
Mes recherches sur la stabilité en analyse des données se sont inscrites dans le cadre des travaux du laboratoire de statistique mathématique de l'ISUP (dirigé par J-P. Benzécri). De 1971 à 1979, avec ma collègue B. Escofier, nous avons étudié des problèmes de stabilité en prenant pour cadre celui de l'analyse en composantes principales ou de l'analyse des correspondances (cf. le chapitre 2 de l'HDR et les articles clefs [1972], [1977]). Pour résoudre ces problèmes de stabilité, nous avons d'abord étudié la rotation des sous-espaces invariants d'un endomorphisme symétrique par une perturbation, en particulier pour des perturbations de rang un (cf. HDR p.10-11). Le but de nos travaux de stabilité est d'étudier la sensibilité des méthodes de détermination des droites et variables principales en AC, ACM et ACP à différents types de modification : perturbation portant sur la structure euclidienne (changement de métrique) ou sur les points (suppression/ajout de points, projection sur un sous-espace, regroupement). Ces travaux font référence dans la littérature internationale sur l'analyse des données multidimensionnelles (Lebart, Greenacre, Gifi ...), ces thèmes ont été repris dans le cadre de l'analyse de sensibilité (Benasseni, Pack & Joliffe, Lauro & Balbi) ...cf. ref. complementaires J'ai, dans mon HDR, fait une synthèse de ces travaux en les présentant sous la forme plus générale de l'étude d'un nuage euclidien. Cette synthèse est reprise dans le chapitre 7 du livre Kluwer (à paraître). |
|||||
2) Analyse des données structurées | |||||
Dans le cadre du Groupe Mathématiques et Psychologie (CNRS et Université René Descartes), j'ai centré mes travaux sur les données d'observation, et l'objectif central de mes recherches a été de travailler à une synthèse de l'analyse des données et l'analyse de la variance telle qu'elle a été abordée par Rouanet et Lépine, d'où l'analyse des données structurées, c'est-à-dire l'analyse de nuages munis des structures classiques en analyse de la variance, notamment le croisement et l'emboîtement (cf. chapitre 3 de l'HDR et les articles [1984] et [1991]). Cet objectif s'est trouvé au centre de l'ATP franco-britannique -- co-responsables H. Rouanet (CNRS) et B. Everitt (University of London) -- ayant pour thème l'"Etude comparative des méthodes statistiques d'analyse d'enquêtes" (de 1985 à 1988). Il en est résulté une comparaison de la notion d'interaction dans les tableaux de contingence, par l'analyse des correspondances et par les modèles log-linéaires. Cet objectif a été repris par R. Sabatier dans sa thèse (1987)1 et développé dans le cadre de l'ACP sur variables instrumentales (ACPVI). Ce thème correspond à l'un (analyse structurelle des données) des 7 axes de recherche de l'équipe de recherche MAP5 (CNRS et Université Paris 5).L'analyse des données structurées est présentée dans le chapitre 6 du livre Kluwer. |
|||||
3) Inférence en Analyse des données | |||||
J'ai abordé les problèmes spécifiques d'inférence en Analyse des données. J'ai, en particulier, étendu la notion de valeur-test pour la comparaison de plusieurs groupes en ACP et ACM (cf. chapitre 4 de l'HDR, ainsi que la référence [1998]). Par ailleurs, le chapitre du livre [1998] présente une application de l'inférence bayésienne à des données structurées relevant de l'ACP : une des conclusions est que la famille des ellipses d'inertie du nuage obtenue par l'ACP peut être réinterprétée comme la famille des ellipses de crédibilité. | |||||
Ces dernières années, j'ai mené un certain nombre de collaborations approfondies avec des chercheurs de premier plan dans plusieurs domaines en sciences humaines (racisme, espace politique, champ éditorial et accidentologie) et en sciences biologiques (nutrition et épilepsie) (voir chapitre 5 de l'HDR, et les références des pages 62-63). Je voudrais souligner que ces applications m'amènent, en retour, à poursuivre vigoureusement les approfondissements théoriques de l'Analyse Géométrique des Données, tels que l'analyse spécifique (cf. [1999]). |
|||||
Page précédente |