|
|||||
|
|||||
Mes travaux portent sur l'analyse géométrique des
données, c'est- à-dire sur les méthodes d'analyse statistique multidimensionnelle
centrées autour de la détermination d'axes principaux. Ces méthodes sont
présentées dans un cadre géométrico-formel qui met l'accent sur les concepts
fondamentaux de nuage (dans un espace affin puis euclidien) et de dualité entre mesures et variables (en termes d'algèbre linéaire). Ces travaux
se répartissent selon trois thèmes.
Le permier thème concerne les problèmes de stabilité d'un nuage euclidien. La démarche adoptée consiste à partir d'un nuage euclidien de référence et à le comparer à un nuage s'en déduisant par une perturbation portant soit sur la structure euclidienne (changement de métrique), soit sur les points (supression/ajout de points, projection sur un sous-espace, regroupements de points); les résultats sont ensuite appliqués aux différents nuages considérés en analyse en composantes principales et en analyse des correspondances simples et multiples. Pour mesurer l'influence de la perturbation, on donne un intervalle de variation des valeurs propres et des majorations des angles de rotation des sous-espaces principaux en fonction des valeurs propres, contributions et qualités de représentation des points du nuage de référence. Ces études de stabilité renvoient aux problèmes d'algèbre linéaire suivants : comparer les valeurs propres et étudier la rotation des sous-espaces invariants d'un endomorphisme symétrique A lorsqu'on lui ajoute un endomorphisme symétrique B (C = A + B), et/ou le mutiplie par B (C = BA avec B > 0). Les majorations sont exprimées en fonction des valeurs propres de A (ou C) et de la perturbation B, et si B est de rang un, de la position du sous-espace invariant de B associé à sa valeur propre non nulle par rapport à ceux de A ou C. Le deuxième thème porte sur l'analyse des données structurées, c'est-à-dire des nuages munis de structures classiques en analyse de la variance (notamment l'emboîtement et le croisement). En particulier, j'étudie en détail la décomposition d'un nuage pondéré indexé par le croisement de deux facteurs en nuage additif et nuage d'interaction. Le troisième thème aborde l'inférence statistique, d'abord dans le cadre de l'inférence combinatoire avec les tests du hasard, puis dans celui de l'inférence bayésienne. La méthode combinatoire est traitée en détail pour l'analyse des correspondances multiples ; la méthode bayésienne est appliquée à des données géométriques structurées relevant de l'analyse en composantes principales. Enfin je présente des travaux de statistique appliquée ayant donné lieu à des collaborations approfondies avec les chercheurs de plusieurs domaines en sciences humaines (espace politique, racisme, champ éditorial et accidentologie) et en sciences biologiques (nutrition et épilepsie). |
|||||
Page précédente |