Visualisierung parraleler Koordinaten in Excel
Dieses Tutorium zeigt, wie sich parallele Koordinaten-Diagramme in Excel mithilfe der Software XLSTAT zeichnen lassen. Diese Plots können nützlich sein, um Cluster aus Clustering-Analysen zu beschreiben.
Datensatz für das Erstellen von parallelen Koordinaten
Die Daten aus diesem Tutorial wurden aus einer Studie von 1994 des American Census Bureau extrahiert. Der Datensatz enthält zur Hälfte Beobachtungen, die Individuen mit einem Einkommen unter 50k$ entsprechen, und zur anderen Hälfte Beobachtungen, die Individuen mit einem Einkommen von mehr als 50k$ beschreiben. Für alle Individuen in dieser Stichprobe ist das Ursprungsland die USA.
Das Ziel ist es, darzustellen, ob einige der Deskriptoren (Alter, Anzahl der Studenjahre, Rasse, Geschlecht, Arbeitsstunden pro Woche) einen Einfluss auf das Einkommen der Individuen haben.
Einrichten des Dialogfensters parallele Koordinaten
Nach dem Öffnen von XLSTAT wählen Sie den Befehl XLSTAT / Visualisierung der Daten / Parallele Koordinaten oder klicken Sie auf den entsprechenden Button in der Toolbar "Visualisierung der Daten" (siehe unten).
Nach dem Klicken des Buttons erscheint das entsprechende Dialogfenster der nicht-linearen Regression. Sie können nun die Daten im Excel-Blatt auswählen. Es gibt mehrere Arten die Daten in den XLSTAT Dialogfenstern auszuwählen. Im untersuchten Beispiel beginnen die Daten in der ersten Zeile; es ist daher schneller die Spaltenauswahl zu benutzen. Daher erscheinen im Dialogfenster unten die Auswahlen in Form von Spalten. Dieses Tool akzeptiert das Mischen von numerischen und kategorischen Variablen. Die „Gruppen“ Information wird zum Einfärben der Linien benutzt. Die Option „Mittelwertlinien“ wird aktiviert, damit XLSTAT für jede Gruppe eine Linie darstellen, die dem Mittelwert einer quantitativen Variable und dem Modus einer qualitativen Variable entspricht. Die Option „Neu Skalieren“ erlaubt es, die Verteilung der Daten für alle Variablen zu vergleichen und erleichtert die Visualisierung.
Die Berechnungen beginnen, sobald der Button "OK" geklickt wird. Ein Diagramm wird auf einem neuen Excel-Blatt angezeigt (da die Option Excel-Blatt für die Ausgabe ausgewählt wurde).
Interpretieren von parallelen Koordinaten
Bewegen Sie auf die Registerkarte Diagramm, wo man entscheiden, wie die Handlung aussehen wird können. Wählen Sie die Option Zeige so viele Zeilen wie möglich an.
Man kann nun sehen, dass weiße Männer im oberen Altersbereich mit einer hohen Anzahl an Studienjahren und einer hohen Wochenstundenzahl eine hohe Wahrscheinlichkeit haben ein Einkommen von mehr als 50k$ zu haben. Jedoch kann man bemerken, dass die Anzahl der Wochenstunden nicht sehr diskriminant ist, da die Mittelwerte der beiden Gruppen (50k$) sehr nah beieinander liegen.
War dieser Artikel nützlich?
- Ja
- Nein