Aller au contenu principal

Test t de Student sur deux échantillons indépendants

Jeu de données pour réaliser un test t de Student sur deux échantillons indépendants

Un classeur Excel comprenant à la fois les données utilisées dans cet exemple et les résultats obtenus peut être téléchargé.

Les données proviennent de l'étude de Fisher [Fisher M. (1936), The Use of Multiple Measurements in Taxonomic Problems. Annals of Eugenics, 7, 179 -188]. Le jeu de données contient des informations descriptives sur 100 iris, à savoir la longueur et largeur des sépales et pétales. Le jeu de données d'origine contient les informations de 150 fleurs appartenant à 3 espèces différentes. Dans ce tutoriel nous n'utilisons que deux espèces : versicolor et virginica.

Le but de ce tutoriel est de tester pour les 4 variables descriptives s'il y a une différence significative entre les deux espèces.

iris_versicolor.jpgiris_virginica.jpg

Iris versicolor et virginica.

Paramétrer un test t de Student sur deux échantillons indépendants

Une fois XLSTAT ouvert, sélectionnez la commande XLSTAT / Tests paramétriques / Tests t et z pour deux échantillons, ou cliquez sur le bouton correspondant dans la barre de menu.

La boîte de dialogue Tests t et z pour deux échantillons apparaît.

Le format des données est une colonne par variable car les données pour les deux échantillons sont dans le même tableau. L'option une colonne par échantillon correspond au cas où les données sont dans des tableaux différents par échantillon. La troisième option correspond au cas où les échantillons sont appariés.

Nous allons faire un test t de Student et non pas un test z.

Dans l'onglet Options, nous laissons les options par défaut, par contre dans l'onglet Graphiques, il faut activer l'option diagramme de dominance.

Lancez les calculs en cliquant sur OK. Les résultats sont affichés dans une nouvelle feuille Excel.

Interpréter les résultats d'un test t de Student sur deux échantillons indépendants

Les premiers résultats affichés sont les statistiques descriptives pour chaque échantillon. Ensuite viennent les résultats du test pour chaque variable les uns après les autres.

Ci-dessous sont les résultats pour la première variable : Longueur Sépales. Le test présente une p-value inférieure au seuil de 5% on peut donc rejeter l'hypothèse nulle et conclure que la longueur des sépales est significativement différente entre les deux espèces.

Le diagramme de dominance permet de comparer visuellement les deux échantillons. Le premier échantillon est représenté sur l'axe des abscisses et le second sur l'axe des ordonnées. Ici l'on peut voir que la longueur des sépales est plus importante pour l'espèce Virginica.

Les deux graphiques en-dessous permettent à la fois de visualiser les distributions de deux échantillons et les résultats du t-test.

Cet article vous a t-il été utile ?

  • Oui
  • Non