Direkt zum Inhalt

Filtern von Beobachtungen und Variablen in einer HKA

Dieses Tutorium zeigt, wie die Lesbarkeit der Diagramme der Hauptkomponenten-Analyse (HKA) durch Entfernen von weniger wichtigen Variablen oder Beobachtungen verbessert werden kann.

Datensatz für die Durchführung einer Hauptkomponenten-Analyse

Absicht dieses Tutoriums

Unsere Absicht besteht darin, die Korrelation zwischen den Variablen zu analysieren und herauszufinden, ob die Bevölkerungsveränderungen in einigen Staaten sich sehr von denen in anderen Staaten unterscheidet. Ein allgemeines Tutorium zum Durchführen einer Hauptkomponenten-Analyse mit XLSTAT ist hier verfügbar. Wir konzentrieren uns auf die in einer HKA angezeigten Diagramme. XLSTAT bietet eine Option zum Filtern der angezeigten Beobachtungen und Variablen in Bezug auf die quadrierten Cosinuswerte (cos²). Diese Messung ist ein Maß für die Qualität der Darstellung der Beobachtung in den erhaltenen Diagrammen.

Einrichten einer Hauptkomponenten-Analyse

Nach dem Aktivieren von XLSTAT-Pro wählen Sie den Befehl XLSTAT/Analyse der Daten/Hauptkomponenten-Analyse oder klicken Sie auf den entsprechenden Button der Symbolleiste Analyse der Daten (siehe unten). XLSTAT Analyzing Data menu / PCA

Das Dialogfenster Hauptkomponenten-Analyse wird angezeigt.

Markieren Sie die Daten in dem Excel-Tabellenblatt. Das ausgewählte Datenformat ist Beobachtungen/Variablen aufgrund des Formats der Eingabedaten.

Der HKA-Typ, der während der Berechnungen verwendet wird, ist die Pearson-Korrelationsmatrix, welche dem klassischen Korrelationskoeffizienten entspricht.

XLSTAT principal component analysis dialog box general tab

In der Registerkarte Diagramme möchten wir die Beobachtungen und Variablen mit einer Summe der quadrierten Cosinuswerte größer als 0,5 filtern. Hierzu aktivieren Sie die Filteroption und wählen Sie >cos² und tragen Sie den Wert 0,5 ein.

XLSTAT Principal Component Analysis dialog box variables charts tab

XLSTAT Principal Component Analysis dialog box observations charts tab

XLSTAT Principal Component Analysis dialog box biplots charts tab

Die Berechnungen beginnen, sobald Sie auf OK geklickt haben. Sie werden aufgefordert, die Anzahl der Zeilen und Spalten zu bestätigen.

Danach müssen Sie die Achsen bestätigen, für die Sie Diagramme anzeigen möchten. In diesem Beispiel ist der Prozentsatz der Variabilität, repräsentiert durch die ersten beiden Faktoren, nicht sehr hoch (67,72 %); um eine Fehlinterpretation der Ergebnisse zu vermeiden, empfehlen wir zusätzlich die Untersuchung der dritten Achse. Hierzu führen Sie die Analyse erneut durch und wählen Sie eine Achsenkonfiguration, die PC3 umfasst, aus.

XLSTAT Principal Component Analysis axis selection PC1 and PC2’’’’XLSTAT Principal Component Analysis axis selection PC1 and PC3

Gefilterte Diagramme für die Hauptkomponenten-Analyse

Alle klassischen Ergebnisse werden angezeigt. Ein detailliertes Tutorium zur Interpretation dieser Ergebnisse finden Sie hier.

Wir interessieren uns für die Tabellen der quadrierten Cosinuswerte und die HKA-Diagramme.

Bei der Betrachtung der Variablen können wir sehen, dass zwei Variablen einen quadrierten Cosinuswert kleiner 0,5 für die ersten beiden Faktoren haben (föderaler/ziviler Umzug... /Auslandseinwanderung). Diese Variablen werden durch die HKA schlecht dargestellt. Sie werden im Korrelationsdiagramm der HKA nicht angezeigt.

squared cosines table

Das erhaltene HKA-Korrelationsdiagramm sieht wie folgt aus.

squared cosines chart

Bei der Betrachtung der Beobachtungen können wird sehen, dass einige Staaten schlecht repräsentiert sind.

squared cosines table

Beispielsweise erscheinen der District of Columbia und Hawaii nicht im Beobachtungsdiagramm, da sie einen quadrierten Cosinuswert kleiner 0,5 für die ersten beiden Faktoren haben.

squared cosines plot

Dieses einfache Tool ermöglicht das Filtern der Beobachtungen in den HKA-Diagrammen, um besser lesbare Diagramme zu erhalten.

War dieser Artikel nützlich?

  • Ja
  • Nein