Intelligente Pivot Tabellen in Excel erstellen
Dieses Tutorium zeigt die Verwendung der XLSTAT-Funktion intelligente Pivot-Tabelle, die erhebliche Vorteile im Vergleich mit den klassischen Pivot-Tabellen in Excel aufweist.
Datensatz für das Erstellen einer intelligenten Pivot-Tabelle
Absicht dieses Tutoriums
Das Ziel besteht hier darin, schnell eine Pivot-Tabelle und ein Verteilungsdiagramm zu erstellen, die dem Benutzer dabei helfen sollen, zu verstehen, welche Faktoren und Kombination von Faktoren sich am stärksten auf die Tatsache auswirken, ob ein Individuum ein Einkommen von größer oder kleiner als 50.000 USD hat (die entsprechende Variable befindet sich in Spalte J). Mit XLSTAT ist dieser Vorgang schnell und einfach.
Generieren einer intelligenten Pivot-Tabelle
Nach dem Öffnen von XLSTAT wählen Sie den Befehl XLSTAT / Beschreibung der Daten / Pivot oder klicken Sie auf den entsprechenden Button des Menüs Beschreibung der Daten (siehe unten).
Nach dem Klicken des entsprechenden Buttons erscheint das Dialogfenster Pivot.
Markieren Sie die Daten in dem Excel-Tabellenblatt. Da die erste Zeile den Namen und die nächsten Zeilen den Daten entsprechen, ist es möglich, den schnellsten Auswahlmodus von XLSTAT zu verwenden: Wählen Sie direkt Spalten, indem Sie auf die entsprechenden Buchstaben klicken.
Wählen Sie die Option Beschriftungen eingeschlossen, da die erste Zeile dem Namen der Variablen entspricht.
Beachten Sie, dass die erklärenden Variablen und die Antwortvariablen entweder qualitativ oder quantitativ sein können.
Da die zu erklärende Variable eine qualitative Variable ist, wählen Sie qualitativ für den Variablentyp. Danach wählen Sie die Zielmodalität, die in der Kreuztabelle verwendet werden soll. In unserem Fall konzentrieren wir uns auf den Fall „>50K“.
Klicken Sie dann auf OK, sodass XLSTAT-Pivot die Berechnungen beginnen kann. Der Pivot-Algorithmus basiert auf Klassifikationsbäumen und dem CHAID-Algorithmus.
Das nächste Dialogfenster zeigt die Optionen zum Erstellen der optimalen Kreuztabellen an. Wählen Sie die Variablen, die Sie in der Kreuztabelle verwenden möchten. Die Beiträge der Variablen zum Modell werden neben dem Variablennamen angezeigt (je höher der Beitrag, desto mehr Informationen stehen zur Verfügung, um die Variabilität der erklärenden Variable zu erläutern).
Sobald Sie mit der Auswahl zufrieden sind (in diesem Beispiel haben wir nichts an den Standardoptionen geändert), klicken Sie auf Fortfahren.
Interpretieren einer intelligenten Kreuztabelle
Ein neues Tabellenblatt wird mit einem Histogramm der Beiträge der Variablen und einer dynamischen Kreuztabelle angezeigt.
Das Diagramm bestätigt, dass die Variablen mit dem höchsten Effekt auf das Einkommen der Familienstand gefolgt von der Dauer der Ausbildung in Jahren sind. Die dynamische Kreuztabelle kann bis zu 4 Werte für jede Kategorien-Kombination anzeigen:
- Antwortmittel: Prozentsatz der Fälle, in denen die Ziel-Kategorie der Antwortvariablen im Fall einer qualitativen Variablen vorhanden ist; Mittelwert der Zielvariablen berechnet aus der Subpopulation entsprechend der Kombination im Fall einer kontinuierlichen Variable;
- Antwortgröße: Anzahl der Ereignisse der Ziel-Kategorie für die Antwortvariable im Fall einer qualitativen Variablen;
- Populationsgröße %: Prozent der Gesamtpopulation entsprechend der Kombination;
- Populationsgröße: Populationsgröße entsprechend der Kombination.
Die Kreuztabelle sieht wie folgt aus:
Wir müssen nun die dynamische Kreuztabelle analysieren, um die Kombinationen zu ermitteln, die sich am stärksten auf die Tatsache auswirken, ob eine Person mehr als 50.000 USD verdient.
Beachten Sie, dass sobald Sie eine Kreuztabelle haben, es interessant sein könnte, eine entsprechende Analyse durchzuführen, um festzustellen in welchem Zusammenhang die Kategorien der verschiedenen erklärenden Variablen zueinander stehen. Zum Erstellen der Eingabetabelle behalten Sie nur die „Antwortgrößen“-Werte bei.
War dieser Artikel nützlich?
- Ja
- Nein