Direkt zum Inhalt

Chi-Quadrate und Fishers Exakter Test in Excel

Dieses Tutorium wird Ihnen helfen, Chi-Quadrat- und exakte Fisher-Tests zu Kontingenztabellen in Excel mithilfe der Software XLSTAT einzurichten und zu interpretieren. Sie sind sich nicht sicher, ob dies der statistische Test ist, nach dem Sie suchen? Weitere Hinweise finden Sie hier.

Datensatz für die Durchführung von Chi-Quadrat- und exakten Fisher-Tests zu Kontingenztabellen

Für dieses Tutorium verwenden wir eine Kontingenztabelle, die Bestände von Bananen enthält, die an einem Marktstand gesammelt wurden- Die Tabelle kreuzt zwei qualitative Variablen: Bananensorte in Spalten (3 Kategorien: 1, 2 und 3) und Präsenz von Maden in den Bananen in Zeilen (zwei Kategorien: Präsenz, Abwesenheit). Jede Zelle enthält die Anzahl der Bananen mit der Kombination der entsprechenden Zeilen- und Spaltenkategorie.

Contingency table

Die Absicht dieses Tutoriums besteht darin, die Chi-Quadrat- und **exakten Fisher-**Tests dazu zu verwenden, die Verbindung zwischen zwei qualitativen Variablen, die an einer Bananenstichprobe gemessen wurden, zu testen: Sorte und Präsenz/Abwesenheit von Maden. Weitere Details finden Sie im nachstehenden Abschnitt.

Wo liegt der Unterschied zwischen dem Chi-Quadrat-Test und dem exakten Fisher-Test zu Kontingenztabellen?

Konzeptionell stellen der Chi-Quadrat-Test und der exakte Fisher-Test die gleiche Nullhypothese in Frage und können folglich dieselbe Fragestellung beantworten.

H0 (Nullhypothese): Die beiden qualitativen Variablen sind unabhängig. In unserem Beispiel würde dies bedeuten, dass die Präsenz/Abwesenheit von Maden unabhängig von der Bananensorte ist. Anders gesagt ist das Verhältnis der befallenen Bananen bei allen drei Sorten gleich.

Nachfolgend finden Sie einen Vorschlag einer Alternativhypothese (zweiseitig):

Ha (Alternativhypothese): Die beiden qualitativen Variablen sind voneinander abhängig. In unserem Beispiel würde dies bedeuten, dass die Präsenz/Abwesenheit von Maden von der Bananensorte abhängt. Anders gesagt, weist mindestens eine der Bananenarten ein Verhältnis des Madenbefalls auf, das sich vom Verhältnis der anderen Sorten unterscheidet.

Der Unterschied zwischen den beiden Tests liegt in der Berechnung der p-Werte.

Der Chi-Quadrat-Test basiert auf der Berechnung einer Chi-Quadrat-Statistik, die den Abstand zwischen den echten Daten und den theoretischen Daten widerspiegelt, falls die Nullhypothese wahr wäre (d. h. theoretische Häufigkeiten mit demselben Verhältnis der befallenen Bananen bei allen Sorten). Diese Statistik wird in einer theoretischen Chi-Quadrat-Verteilung zur Generierung eines p-Werts verwendet. Je höher die Chi-Quadrat-Statistik, desto niedriger der p-Wert. Beachten Sie, dass XLSTAT die Berechnung theoretischer Häufigkeiten ermöglicht (siehe nachstehende Abschnitte).

Der exakte Fisher-Test berechnet die Wahrscheinlichkeit, die beobachteten Daten zu erhalten (mithilfe der hypergeometrischen Verteilung) sowie die Wahrscheinlichkeiten, alle extremeren, möglichen Datensätze unter die Nullhypothese zu erhalten. Diese Wahrscheinlichkeiten werden zum Berechnen des p-Werts des exakten Fisher-Tests verwendet.

Wenn theoretische Häufigkeiten solche Häufigkeiten beinhalten, die niedriger sind als 5, oder wenn die marginalen Summen des Datensatzes (Summen pro Zeile oder pro Spalte) sehr ungleichmäßig sind, ist es besser, sich auf den exakten Fisher-Test zu verlassen.

Der Chi-Quadrat-Test ist aussagekräftiger (d. h. besser dazu imstande, die Nullhypothese abzulehnen, wenn sie falsch ist) als der exakte Fisher-Test.

Einrichten von Chi-Quadrat- und exakten Fisher-Tests zu Kontingenztabellen in XLSTAT

Sobald XLSTAT-Pro aktiviert ist, gehen Sie zu XLSTAT/Korrelations-/Assoziationstests/Tests zu Kontingenztabellen.

correlation association tests menu

Stellen Sie in der Registerkarte Allgemein sicher, dass das Kontingenztabellen-Datenformat ausgewählt ist, und wählen Sie dann Ihre Daten im Feld Kontingenztabelle aus. Falls Ihre Daten in vertikaler Form organisiert sind (Individuen in Zeilen und Variablen in Spalten), aktivieren Sie die Datenformat-Option Qualitative Variablen. Wenn Sie Ihre Daten von einem vertikalen Format in ein Kontingenztabellenformat umwandeln möchten, bietet dieses Tutorium eine Anleitung.

Contingency tests menu General tab

In der Registerkarte Optionen aktivieren Sie die Optionen Chi-Quadrat-Test und Exakter Fisher-Test.

Contingency tests menu Options tab

In der Registerkarte Ausgabe aktivieren Sie die Optionen Theoretische Häufigkeiten sowie Verhältnisse/Spalte.

Contingency tests menu Outputs tab

Klicken Sie auf den Button OK, um die Berechnungen zu starten. Die Ergebnisse werden in einem neuen Tabellenblatt angezeigt.

Interpretieren der Ausgabe von Chi-Quadrat- und exakten Fisher-Tests zu Kontingenztabellen in XLSTAT

Zuerst zeigt XLSTAT die Ergebnisse an, die mit dem Chi-Quadrat-Test zusammenhängen. Der p-Wert (0,033) ist niedriger als das Signifikanzniveau von 0,05. Somit lehnen wir die Nullhypothese ab, dass die Präsenz von Maden und die Bananensorte unabhängig voneinander sind, wobei das Risiko, dass wir falsch liegen, bei 3,3 % liegt.

Chi square test result

Als nächstes werden die Ergebnisse des exakten Fisher-Tests angezeigt. Auch hier ist der p-Wert (0,044) niedriger als das Signifikanzniveau von 0,05. Der exakte Fisher-Test führt ebenfalls zur Ablehnung der Nullhypothese.

Fisher exact test result

Beachten Sie, dass der mit dem Chi-Quadrat-Test erhaltene p-Wert geringfügig niedriger ist als der in Zusammenhang mit dem exakten Fisher-Test. Dies ist meistens der Fall, da der Chi-Quadrat-Test aussagekräftiger ist als der exakte Fisher-Test.

Dann zeigt die Tabelle theoretische Häufigkeiten die Häufigkeiten an, die man erhalten hätte, wenn die Nullhypothese wahr gewesen wäre. Eine einfache Berechnung zeigt, dass das Verhältnis der Bananen mit Maden bei allen Sorten identisch ist (11,8 %). Wir stellen fest, dass eine der Häufigkeiten geringer als 5 ist. Daher bevorzugen wir, uns nicht auf die Ergebnisse des Chi-Quadrat-Tests zu verlassen und nur den exakten Fisher-Test anzugeben.

Theoretical frequencies

Die Tabelle Verhältnisse/Spalte zeigt die Verhältnisse der Bananen mit und ohne Maden für jede der drei Sorten. Gemäß den Ergebnissen der Tests können wir sagen, dass mindestens eines der Verhältnisse (0,121, 0,104 und 0,300) sich signifikant von den anderen unterscheidet.

Proportions per column table

War dieser Artikel nützlich?

  • Ja
  • Nein