Pasar al contenido principal

Tests heterocedasticidad Breusch-Pagan & White

Este tutorial le mostrará cómo ejecutar e interpretar las pruebas de heteroscedasticidad de Breusch-Pagan & White en Excel usando el software XLSTAT.

Datos para la realización de pruebas de heterocedasticidad Breusch-Pagan y White en XLSTAT

Para este tutorial usamos un conjunto de datos artificial construido con el propósito de comparar un modelo con homocedasticidad con otro con fuerte heterocedasticidad. Los datos corresponden a un experimento cuyo objetivo fue probar el efecto de la edad (medido en días) sobre el contenido de azúcar y sobre el tamaño de una nueva variedad de fruta. La primera regresión (contenido de azúcar) presenta homocedasticidad mientras que la segunda (tamaño) es fuertemente heterocedástica. Para ver detalles técnicos sobre la forma en que hemos generado los datos, por favor vaya a la última sección de este tutorial.

Objetivo de este tutorial

El objetivo de este tutorial es comprobar si la variabilidad de una variable dependiente (por ejemplo: contenido de azúcar o tamaño) cambia con una variable explicativa (edad) en una regresión lineal. Técnicamente, estamos preguntando si los residuos de la regresión se distribuyen heterogéneamente a lo largo de la variable explicativa. Si ese fuera el caso, hablamos de heterocedasticidad. Muy a menudo, el tamaño de un organismo es más variable con la edad. Comparemos a los bebés con los adultos: los bebés tienen relativamente alturas “estándar”, mientras que las alturas adultas son muy variables. Este es un caso típico de heterocedasticidad. Vamos a utilizar las pruebas de heterocedasticidad de Breusch-Pagan y White para mostrar cómo funcionan estas pruebas en dos situaciones extremas: homocedasticidad y fuerte heterocedasticidad.

Pruebas de heterocedasticidad de Breusch-Pagan y White: ¿Qué hipótesis estamos probando?

Las pruebas de heteroscedasticidad implican las dos siguientes hipótesis. H0 (hipótesis nula): los datos son homocedásticos. Ha (hipótesis alternativa): los datos son heterocedásticos. Por lo tanto, si el valor p asociado a una prueba de heterocedasticidad cae por debajo de un cierto umbral (por ejemplo, 0.05), llegaríamos a la conclusión de que los datos son significativamente heterocedásticos.

Ejecución de las pruebas de heterocedasticidad de Breusch-Pagan y White en XLSTAT

Abra el menú XLSTAT y haga clic en Análisis de series temporales / Pruebas de heterocedasticidad. Seleccione la columna Residuals(Sugar) en la caja Residuos, y la columna Age en el cuadro de variables explicativas. Marque la casilla Prueba de White y ponga en marcha el análisis haciendo clic en el botón OK. Los resultados de este primer análisis se muestran en una nueva hoja.

Heteroscedasticity tests dialog box

Repita el mismo procedimiento con la columna Residuals(Size) seleccionada en el cuadro de Residuos.

Interpretación

Para la variable contenido de azúcar, el gráfico de residuos / Edad muestra una distribución relativamente homogénea de los residuos a lo largo de la variable edad.

Heteroscedasticity: Sugar residuals/Age chart

Por otra parte, ambas pruebas muestran altos valores de p (0.322 para la prueba de Breusch-Pagan y 0.296 para la prueba de White), lo que sugiere que no se puede rechazar la hipótesis nula de que los residuos sean homocedásticos.

Heteroscedasticity: BP test result for sugar content

Para la variable Size, el gráfico de residuos / Edad claramente muestra que los residuos se hacen más variables conforme los frutos crecen. Esta forma de cono es un caso muy común de heterocedasticidad.

Heteroscedasticity: Size residuals/Age chart

Además, podemos ver que el valor de p para ambas pruebas está de lejos por debajo del nivel de significación de 0.05. En consecuencia, tenemos que rechazar la hipótesis nula de que los residuos son homocedásticos, lo que coincide con lo que se sugiere en el gráfico.

Heteroscedasticity: BP test result for size

Información adicional: cómo se generó el conjunto de datos de este tutorial

La variable dependiente contenido de azúcar se construye como la suma de dos veces la variable edad y un error normal al azar en torno a cero. Este error representa residuos. Este es un caso típico en el que los residuos son independientes e idénticamente distribuidos. Para la segunda variable dependiente (tamaño), los residuos se convierten en el producto de la Edad por el error normal aleatorio. En este caso los residuos no son obviamente independientes. Para más información, por favor, consulte la hoja de información adicional incluida en el conjunto de datos del tutorial.

¿Ha sido útil este artículo?

  • No