Combinatorial Inference in Geometric Data Analysis

Données et scripts R simplifiés
  English version

Les scripts R présentés ci-après sont des scripts simplifiés qui calculent les seuils observés (p-values) et les régions de compatibilité dans des cas simples.
Pour la mise en œuvre complète des méthodes présentées dans le livre, voir scripts R complets et interfacés avec SPAD
.

Chapitre 3.

Tests combinatoires de typicalité

 

Le test combinatoire de typicalité consiste à comparer un groupe d'observations à une population de référence en prenant comme statistique de test soit le carré de la distance de Mahalanobis entre points moyens soit la variance du nuage.

  • Cas multidimensionnel (nuages euclidiens)
  • Cas unidimensionnel (variable numérique)
    Le script R précédent appliqué à un nuage unidimensionnel procède au test avec pour statistique de test le carré de l'écart calibré entre les moyennes et non au test directionnel basé sur la différence des moyennes.

Chapitre 4.

Test géométrique de typicalité

 

Le test géométrique de typicalité consiste à comparer le point moyen d'un nuage euclidien à un point référence en prenant comme statistique de test le carré de la distance de Mahalanobis entre points. Ce test s'applique aussi à 'un plan avec deux mesures répétées, les données de base étant alors le "protocole des différences".

  • Cas multidimensionnel (nuages euclidiens)
  • Cas unidimensionnel (variable numérique)
    Le script R précédent appliqué à un nuage unidimensionnel donne les résultats correspondant à l'écart calibré entre la moyenne du groupe et la moyenne de référence.
  • Cas d'un plan avec deux mesures répétées
        Données de Student: Student.txt

Chapitre 5.

Tests d'homogénéité

 

Les tests d'homogénéité présentés dans ce chapitre consistent à comparer plusieurs sous-nuages en prenant comme statitique de test la M-variance des points moyens des sous-nuages (c'est-à-dire la variance calculée à partir de la distance de Mahalanobis entre points). Nous étudions le cas d'un plan avec plusieurs groupes indépendants et celui avec des mesures répétées.
Dans le cas de plusieurs groupes indépendants, plusieurs sytèmes de permutation des données sont envisagés selon que la comparaison est globale, partielle ou spécifique (voir pages 109-110).

  • Le script R (Homogeneity.R) des pages 142-147 permet de calculer le seuil observé du test (p-value) et la région de compatibilité dans le cas de la comparaison partielle ou spécifique de deux groupes indépendants.
  • Le fichier des données de la page 142 est Target_4.txt.

Page précédente