Filtern von Beobachtungen und Variablen in einer HKA
Dieses Tutorium zeigt, wie die Lesbarkeit der Diagramme der Hauptkomponenten-Analyse (HKA) durch Entfernen von weniger wichtigen Variablen oder Beobachtungen verbessert werden kann.
Datensatz für die Durchführung einer Hauptkomponenten-Analyse
Absicht dieses Tutoriums
Unsere Absicht besteht darin, die Korrelation zwischen den Variablen zu analysieren und herauszufinden, ob die Bevölkerungsveränderungen in einigen Staaten sich sehr von denen in anderen Staaten unterscheidet. Ein allgemeines Tutorium zum Durchführen einer Hauptkomponenten-Analyse mit XLSTAT ist hier verfügbar. Wir konzentrieren uns auf die in einer HKA angezeigten Diagramme. XLSTAT bietet eine Option zum Filtern der angezeigten Beobachtungen und Variablen in Bezug auf die quadrierten Cosinuswerte (cos²). Diese Messung ist ein Maß für die Qualität der Darstellung der Beobachtung in den erhaltenen Diagrammen.
Einrichten einer Hauptkomponenten-Analyse
Nach dem Aktivieren von XLSTAT-Pro wählen Sie den Befehl XLSTAT/Analyse der Daten/Hauptkomponenten-Analyse oder klicken Sie auf den entsprechenden Button der Symbolleiste Analyse der Daten (siehe unten).
Das Dialogfenster Hauptkomponenten-Analyse wird angezeigt.
Markieren Sie die Daten in dem Excel-Tabellenblatt. Das ausgewählte Datenformat ist Beobachtungen/Variablen aufgrund des Formats der Eingabedaten.
Der HKA-Typ, der während der Berechnungen verwendet wird, ist die Pearson-Korrelationsmatrix, welche dem klassischen Korrelationskoeffizienten entspricht.
In der Registerkarte Diagramme möchten wir die Beobachtungen und Variablen mit einer Summe der quadrierten Cosinuswerte größer als 0,5 filtern. Hierzu aktivieren Sie die Filteroption und wählen Sie >cos² und tragen Sie den Wert 0,5 ein.
Die Berechnungen beginnen, sobald Sie auf OK geklickt haben. Sie werden aufgefordert, die Anzahl der Zeilen und Spalten zu bestätigen.
Danach müssen Sie die Achsen bestätigen, für die Sie Diagramme anzeigen möchten. In diesem Beispiel ist der Prozentsatz der Variabilität, repräsentiert durch die ersten beiden Faktoren, nicht sehr hoch (67,72 %); um eine Fehlinterpretation der Ergebnisse zu vermeiden, empfehlen wir zusätzlich die Untersuchung der dritten Achse. Hierzu führen Sie die Analyse erneut durch und wählen Sie eine Achsenkonfiguration, die PC3 umfasst, aus.
’’’’
Gefilterte Diagramme für die Hauptkomponenten-Analyse
Alle klassischen Ergebnisse werden angezeigt. Ein detailliertes Tutorium zur Interpretation dieser Ergebnisse finden Sie hier.
Wir interessieren uns für die Tabellen der quadrierten Cosinuswerte und die HKA-Diagramme.
Bei der Betrachtung der Variablen können wir sehen, dass zwei Variablen einen quadrierten Cosinuswert kleiner 0,5 für die ersten beiden Faktoren haben (föderaler/ziviler Umzug... /Auslandseinwanderung). Diese Variablen werden durch die HKA schlecht dargestellt. Sie werden im Korrelationsdiagramm der HKA nicht angezeigt.
Das erhaltene HKA-Korrelationsdiagramm sieht wie folgt aus.
Bei der Betrachtung der Beobachtungen können wird sehen, dass einige Staaten schlecht repräsentiert sind.
Beispielsweise erscheinen der District of Columbia und Hawaii nicht im Beobachtungsdiagramm, da sie einen quadrierten Cosinuswert kleiner 0,5 für die ersten beiden Faktoren haben.
Dieses einfache Tool ermöglicht das Filtern der Beobachtungen in den HKA-Diagrammen, um besser lesbare Diagramme zu erhalten.
War dieser Artikel nützlich?
- Ja
- Nein