Mittelwert, Medianwert, Standardabweichung und mehr in Excel
In dieser Anleitung wird gezeigt, wie der Mittelwert, der Median und andere deskriptive Statistiken für quantitative Daten in Excel mithilfe der XLSTAT-Software berechnet und interpretiert werden.
Datensatz zur Beschreibung quantitativer Daten
Die Daten stellen die Ergebnisse einer Umfrage dar, wie viel Geld die Menschen beim Online-Einkauf monatlich durchschnittlich ausgeben. Die Zeilen entsprechen den Befragten und Spalten der ausgegebenen Geldmenge sowie der Altersgruppe, zu der sie gehören. Unser Ziel ist es, die Ergebnisse pro Altersgruppe anhand allgemeiner deskriptiver Statistiken zusammenzufassen, wie zum Beispiel :
- Mittelwert und Medianwert, die die zentralen Tendenzen widerspiegeln
- Die Standardabweichung, die Varianz und der Variationskoeffizient, welche die Streuung widerspiegeln.
Auf diese Weise können wir wichtige Informationen aus der Umfrage extrahieren und mögliche Unterschiede zwischen den Gruppen erkennen.
Erstellen des Dialogfelds für deskriptive Statistiken
1. Wenn XLSTAT geöffnet ist, wählen Sie den Menüpunkt XLSTAT / Daten Beschreibung / Deskriptive Statistiken aus (siehe unten).
2. Das Dialogfeld deskriptive Statistiken wird angezeigt.
3. Wählen Sie in der Registerkarte Allgemein im Feld Quantitative Daten die Spalte aus, die den Geldbeträgen entspricht, die für den Online-Einkauf ausgegeben werden.
Wählen Sie dann die Spalte, die der Altersklasse entspricht, im Feld Unterstichprobe aus.
Wir möchten auch Variablen-Kategoriebeschriftungen in der Ausgabe anzeigen. Dazu gehören der Variablenname als Präfix und der Kategoriename als Suffix.
Wählen Sie schließlich die Option Sheet aus, um die Ergebnisse auf einem neuen Blatt anzuzeigen, und die Stichprobenbeschriftung, um die erste Zeile der Datentabelle als Beschriftungen zu betrachten.
4. Aktivieren Sie in der Registerkarte Optionen die folgenden Optionen.
In dieser Anleitung konzentrieren wir uns auf deskriptive Statistiken, sodass wir keine Diagramme aktivieren.
Da es sich nur um eine einzige Variable handelt, wählen wir nicht die Option Normalisierung oder Re-skalieren aus. Dies ist interessanter bei mehreren Variablen, die auf verschiedenen Skalen gemessen werden.
5. Klicken Sie in der Registerkarte Ergebnis auf die Schaltfläche Alle, um alle Statistiken für quantitative Daten auszuwählen.
Interpretation der deskriptiven Statistiken für quantitative Daten
Die Ergebnisse werden in einem neuen Sheet mit der Bezeichnung Desc angezeigt. Ein vollständiger Satz beschreibender Statistiken wird für alle Befragten (Spalte B) sowie für jede Altersklasse (Spalten C-E) angezeigt.
Die am häufigsten verwendeten Basisstatistiken sind die Messwerte der zentralen Tendenz (z. B. Mittelwert, Median), die Informationen um den Mittelpunkt der Daten liefern, und die Messgrößen der Streuung (z. B. Standardabweichung, Bereich, Varianz, Variationskoeffizient), die Daten beschreiben Variabilität.
Definitionen und Formeln finden Sie im Menü Hilfe (klicken Sie auf die Schaltfläche Hilfe im Dialogfenster).
a. Interpretation der zentralen Tendenz
Der Mittelwert zeigt, dass die Befragten im Durchschnitt pro Monat 156 USD für Online-Shopping ausgeben.
Der Medianwert liegt bei 139 USD. Dies bedeutet, dass die Hälfte der Befragten mehr als 139 USD und die andere Hälfte weniger als 139 USD ausgibt. Die Daten werden wahrscheinlich rechts schief sein, da der Median etwas niedriger als der Mittelwert ist.
Betrachtet man die drei Altersgruppen, so stellen wir fest, dass Verbraucher zwischen 30 und 45 Jahren im Durchschnitt mehr ausgeben als die beiden anderen Gruppen (Mittelwert und Median). Eine Interpretation könnte darin bestehen, dass Menschen dieser Altersgruppe mehr Geld ausgeben können als jüngere, während sie technophiler sind als ältere Klassen.
b. Interpretation der Dispersion
Junge Verbraucher scheinen im Durchschnitt mehr auszugeben als die ältesten (> 45), weisen jedoch eine höhere Stichproben-Standardabweichung auf (SD = 62). Dies bedeutet, dass es eine breitere Streuung von Werten gibt, die nach Kategorien (30-45) ausgegeben werden, verglichen mit Kategorien (> 45). In ähnlicher Weise können wir sagen, dass ältere Menschen tendenziell ähnliche Beträge ausgeben (niedriger SD). Es können verschiedene Erklärungen gegeben werden. Zum Beispiel könnte man sagen, dass junge Einkäufer unterschiedlichere sozio-professionelle Kategorien (Studenten, Fachleute, Arbeitslose) einschließen als ältere.
Diese Schlussfolgerungen können auch basierend auf der Varianz gezogen werden. Der Vorteil der Verwendung der SD anstelle der Varianz besteht darin, dass der SD die Einheiten der ursprünglichen Skala verwendet.
in weiteres Maß für die Streuung ist der Variationskoeffizient. Diese Maßzahl ist besonders für den Vergleich von Proben mit unterschiedlichen Einheiten interessant, da sie ohne Einheiten ist. Je höher der Variationskoeffizient ist, desto höher ist die Streuung um den Mittelwert.
Standardabweichung (n) oder Standardabweichung (n-1)?
In diesem Tutorial verwenden wir die 150 Befragten als Stichprobe, um die gesamte Bevölkerung zu untersuchen. Dies erklärt unsere Wahl, die Stichprobenabweichung (n-1) für die Interpretation zu verwenden. Im Idealfall, aber unmöglichen Fall, in dem wir Daten für alle Online-Einkäufer sammeln könnten (d. H. Die Online-Käuferbevölkerung), wäre die Bevölkerungszahl SD [Standardabweichung (n)] oder die Populationsvarianz [Varianz (n)] geeigneter.
Was als nächstes kommt: Beschreibung einer quantitativen Variablen mit Boxplots
Looking for a quick and easy way to graphically describe quantitative variables? Box plots are the way to go. This tool provides five basic statistics (minimum, first quartile, median, third quartile, and maximum) at a glance, either for the overall data either by group. Check out our tutorials on box plots and notched box plots here.
Das folgende Video veranschaulicht quantitative deskriptive Statistiken, veranschaulicht mit Excel und XLSTAT.
War dieser Artikel nützlich?
- Ja
- Nein