Diskretisierung kontinuierlicher Variablen in Excel
Dieses Tutorium soll Ihnen dabei helfen, einekontinuierliche Variable basierend auf verschiedenen Methoden in Excel mithilfe von XLSTAT zu diskretisieren.
Datensatz für das Diskretisieren einer kontinuierlichen Variablen und Ziel dieses Tutoriums
Eine MS Excel-Mappe mit den Daten und den Ergebnissen, die in diesem Tutorium behandelt werden, kann hier heruntergeladen werden. Die in diesem Tutorium verwendeten Daten entsprechen einer Liste von Patienten mit Informationen bezüglich ihrer Größe, ihres Gewichts und ihres BMI. In diesem Beispiel haben wir entschieden, die Patienten in verschiedene Gruppen gemäß ihrem BMI einzuteilen.
Einrichten der Diskretisierung einer kontinuierlichen Variable
Wählen Sie nach dem Aktivieren von XLSTAT-Pro XLSTAT/Vorbereitung der Daten/Diskretisierung aus oder klicken Sie auf den entsprechenden Button der Symbolleiste „Vorbereitung der Daten“ (siehe unten). Sie müssen die dem BMI entsprechenden Daten in dem Excel-Tabellenblatt (Spalte D) markieren. Markieren Sie die Option Beschriftung der Spalten, da die Markierung den Variablennamen „BMI“ enthält. Markieren Sie die Option Beschriftungen der Zeilen und wählen Sie den Namen der Patienten (Spalte A).- Konstanter Bereich: Wählen Sie diese Methode, um Klassen mit demselben Bereich zu erstellen. Geben Sie dann den Wert des Bereichs ein. Bei Bedarf können Sie optional das „Minimum“ angeben, das der Untergrenze des ersten Intervalls entspricht.
- Intervalle: Wählen Sie diese Methode, um eine bestimmte Anzahl von Intervallen mit demselben Bereich zu erstellen.
- Gleiche Häufigkeiten: Wählen Sie diese Methode, sodass alle Klassen so viele derselben Anzahl von Beobachtungen wie möglich enthalten.
- Automatisch (Fisher): Verwenden Sie diese Methode, um die Klassen mithilfe des Fisher-Algorithmus zu erstellen.
- Automatisch (k-Means): Wählen Sie diese Methode, um Klassen (oder Intervalle) mithilfe des k-Means-Algorithmus zu erstellen.
- Intervalle (benutzerdefiniert): Wählen Sie diese Option, um eine Spalte auszuwählen, die die Untergrenze des ersten Intervalls und die Obergrenze aller Intervalle in aufsteigender Reihenfolge enthält.
- 80-20: Verwenden Sie diese Methode, um zwei Klassen zu erstellen, wobei die erste die ersten 80 % der Reihe und die zweite die restlichen 20 % enthält, wobei die Daten in aufsteigender Reihenfolge sortiert sind.
- 20-80: Verwenden Sie diese Methode, um zwei Klassen zu erstellen, wobei die erste die ersten 20 % der Reihe und die zweite die restlichen 80 % enthält, wobei die Daten in aufsteigender Reihenfolge sortiert sind.
- 80-15-5 (ABC): Verwenden Sie diese Methode, um zwei Klassen zu erstellen, wobei die erste die ersten 80 % der Reihe, die zweite die nächsten 15 % und die dritte die restlichen 5 % enthält, wobei die Daten in aufsteigender Reihenfolge sortiert sind. Diese Methode wird manchmal als „ABC-Klassifikation“ bezeichnet.
- 5-15-80: Verwenden Sie diese Methode, um zwei Klassen zu erstellen, wobei die erste die ersten 5 % der Reihe, die zweite die nächsten 15 % und die dritte die restlichen 80 % enthält, wobei die Daten in aufsteigender Reihenfolge sortiert sind.
Wir wählen die Option Intervalle (benutzerdefiniert) und verwenden die Grenzen, die für XLSTAT in der Microsoft Excel-Tabelle definiert sind. Gehen Sie zu der Registerkarte Ausgabe, um auszuwählen, welche Ergebnisse berechnet werden sollen. Wählen Sie die Zentroide, Ergebnisse je Klasse und Ergebnisse je Objekt. Gehen Sie zur Registerkarte Diagramme und wählen Sie Histogramme als Balken mit Frequenz. Nach Abschluss klicken Sie auf den Button OK.
Ergebnisse der Diskretisierung einer kontinuierlichen Variable
Die Ergebnisse werden in dem neuen Tabellenblatt mit dem Namen „Diskretisierung“ angezeigt. Das erste Ergebnis ist das Histogramm. Beachten Sie, dass die Größe des Balken der Größe der Klasse entspricht. Daneben finden Sie die Tabelle der deskriptiven Statistiken für die Intervalle. Die meisten Patienten (10) sind in der dritten Klasse, die einem normalen Gewicht entspricht. Dann haben Sie die Klassenschwerpunkte, die möglicherweise nicht identisch mit dem Mittelpunkt jeder Klasse sind. Schließlich haben Sie die Größenstreuung
War dieser Artikel nützlich?
- Ja
- Nein