Direkt zum Inhalt

Bootstrapping in Excel - Anleitung

XLSTAT hat eine Toolbox für wiederholte Stichproben, die verwendet werden kann, um wiederholte Bootstrap-Stichproben, Standardabweichung und Konfidenzintervalle in Excel zu erhalten. Sie ermöglicht die Erstellung von Grafiken basierend auf der Bootstrap-Verteilung.

Datensatz für das Generieren von Bootstrap-Statistiken mithilfe von wiederholten Stichproben

Die Daten entsprechen einer Stichprobe von 150 Schwertlilien, für die 4 Variablen gemessen wurden. Die Blumen gehören zu 3 verschiedenen Spezies. Fisher verwendete diesen mittlerweile berühmten Datensatz bei der Entwicklung seiner Diskriminanzanalyse-Theorie. In diesem speziellen Beispiel, werden wir die Variable Kelchblattlänge der Blüten untersuchen.

Absicht dieses Tutoriums

Mithilfe der XLSTAT Toolbox für wiederholte Stichproben möchten wir Bootstrap-Mittelwerte, Bootstrap-Standardabweichungen und Bootstrap-Konfidenzintervalle für einige statistische Messungen erhalten. Diese Bootstrap-Statistiken werden ohne Verteilungsannahmen erhalten. Wir untersuchen den Mittelwert und die Standardabweichungen der Variablen Kelchblattlänge.

Einrichten erneuter Stichproben

Nach dem Öffnen von XLSTAT wählen Sie den Befehl XLSTAT/Beschreibung der Daten/Statistiken wiederholter Stichproben oder klicken Sie auf den entsprechenden Button des Menüs Beschreibung der Daten (siehe unten).
PIC1.jpg
Nach dem Klicken des entsprechenden Buttons erscheint das Dialogfenster Statistiken wiederholter Stichproben. Die Daten, die der Variablen „Kelchblattlänge“ entsprechen, wurden in dem Excel-Tabellenblatt ausgewählt.

Beachten Sie, dass für erneute Stichproben die Daten numerisch sein müssen.

Da der Name der Variablen in die Auswahl einbezogen wurde, wurde die Option Beschriftungen eingeschlossen ebenfalls ausgewählt.

Die Option Tabellenblatt wurde ausgewählt, da wir wollten, dass die Ergebnisse in einem neuen Tabellenblatt der Arbeitsmappe angezeigt werden. Die ausgewählte Methode für wiederholte Stichproben ist die Bootstrap-Methode mit 200 wiederholten Stichproben.

PIC2.jpg
Wählen Sie in der Registerkarte Ausgabe die zu untersuchenden Statistiken. Wir wählen den Mittelwert und beide Standardabweichungen.

Das 95 % Standard-Bootstrap-Intervall ist ausgewählt. Sie können alle 200 Stichproben und Statistiken wiederholter Stichproben mithilfe der Optionen Wiederholten Stichproben und Statistiken wiederholter Stichproben anzeigen.

PIC3.jpg
In der Registerkarte Diagramme wurden Histogramme ausgewählt.

PIC4.jpg
Klicken Sie auf OK, um die Analyse zu beginnen.

Interpretieren der Ergebnisse der Statistiken wiederholter Stichproben

Die Ergebnisse werden in dem neuen Tabellenblatt mit dem Namen „Erneute Stichproben“ angezeigt.

Die folgende Tabelle fasst die erhaltenen Bootstrap-Statistiken für den Stichproben-Mittelwert und die Standardabweichungen zusammen. Wir können sehen, dass Bootstrap-Schätzungen selbst mit nur 200 wiederholten Stichproben sehr nahe an den ursprünglichen Schätzungen liegen. Für den Mittelwert ist das Standard-Bootstrap-Konfidenzintervall von 95 % sehr eng. Für die Standardabweichungen können wir sehen, dass die stichprobenbasierten und die populationsbasierten Standardabweichungen sehr dicht beieinander liegen und dass Bootstrap-Schätzungen den ursprünglichen Schätzungen sehr ähneln. Konfidenzintervalle sind selbst bei 200 wiederholten Stichproben sehr eng.

PIC5.jpg
Histogramme können verwendet werden, um die Bootstrap-Verteilung des Mittelwerts und der Standardabweichungen zu veranschaulichen. Für den Mittelwert sehen wir, dass 56 der 200 Werte sich im Bereich [58,2; 58,64] befinden, in dem auch der Mittelwert über der ursprünglichen Stichprobe enthalten ist. Die Intervalltabelle ist außerdem angegeben, um die Verteilung besser zu verstehen. Das Tool für wiederholte Stichproben legt automatisch die Anzahl der Intervalle fest. Wenn Sie das Tool an Ihre Analyse anpassen möchten, verwenden Sie einfach die Funktion „Histogramme“ in XLSTAT für die Statistiken wiederholter Stichproben, die Sie erhalten, wenn die Option „Statistiken wiederholter Stichproben“ in der Registerkarte „Ausgabe“ ausgewählt wird.

PIC6.jpg
Dieses Tool ermöglicht es Ihnen, verschiedene Arten von Konfidenzintervallen in einer großen Zahl von deskriptiven Statistiken zu berechnen. Das Hinzufügen von Gewicht und die gleichzeitige Bearbeitung mehrerer Variablen ist ebenfalls möglich.

War dieser Artikel nützlich?

  • Ja
  • Nein