Pasar al contenido principal

Regresión cuantil: tutorial en Excel

Este tutorial le mostrará cómo configurar e interpretar una Regresión Cuantil en Excel usando el software XLSTAT.

¿No está seguro de que esta sea la función de modelado que está buscando? Consulte por favor esta guía.

Datos para ejecutar una regresión cuantil

Los datos provienen de Lewis T. & Taylor L.R. (1967). Introduction to Experimental Ecology, New York: Academic Press, Inc.. Conciernen a 237 niños, descritos por su género, edad en meses, altura en pulgadas (1 pulgada= 2.54 cm), y peso en libras (1 libra = 0.45 kg).

Objetivo de este tutorial sobre Regresión cuantil

Al usar la regresión cuantil, queremos averiguar cómo el peso de los niños varía de acuerdo con su género (una variable cualitativa que toma el valor F y M), su altura y su edad, y para verificar si un modelo lineal tiene sentido. El método de regresión cuantil pertenece a una familia más amplia de modelos llamados GLM (modelos lineales generalizados) al igual que la ANCOVA. La especificidad de la regresión cuantil con respecto a estos otros métodos es la de proporcionar una estimación de cuantiles condicionales de la variable dependiente en lugar de la media condicional. De esta manera, la regresión cuantil permite proporcionar una evaluación más precisa de la calidad basada en un análisis de cuantiles. Las estimaciones de los parámetros en los modelos lineales QR tienen la misma interpretación que las de cualquier otro modelo lineal, como tasas de cambio. Por lo tanto, de una manera similar al modelo de mínimos cuadrados ordinarios (Ordinary Least Squares, OLS), los coeficientes del modelo QR se pueden interpretar como la tasa de cambio de algún cuantil de la distribución de la variable dependiente por unidad de cambio en el valor de algún regresor. Además, al igual que sucede en ANCOVA, es posible mezclar o combinar variables explicativas cualitativas y cuantitativas. En otros tres tutoriales sobre regresión lineal también se utiliza este conjunto de datos, con la altura (regresión lineal), la estatura y la edad (ANOVA) y luego el tamaño, la edad y el género (ANCOVA) como variables explicativas.

Configuración de una Regresión cuantil

Tras abrir XLSTAT, seleccione el comando XLSTAT / Modelazión de datos / Regresión cuantil (ver más abajo).

Menu

Una vez que haya hecho clic en el botón, aparece el cuadro de diálogo Regresión cuantil. Seleccione los datos en la hoja de cálculo de Excel. La variable dependiente (o variable a modelar) es aquí el peso.

Las variables cuantitativas explicativas son la altura y la edad. La variable cualitativa es el género. Como hemos elegido el título de la columna para las variables, dejamos activada la opción Etiquetas de las variables. Las otras opciones se han dejado en su valor por defecto.

Menu

Los cálculos empiezan una vez haya hecho clic en OK. A continuación, se muestran los resultados.

En este estudio, queremos centrar el análisis en los cuantiles para los cuales los coeficientes de la regresión cuantil están lejos de los del ANCOVA.

En el siguiente ejemplo, puesto que no se asumen información a priori que proporcione cuantiles de interés, se ha preferido y ejecutado un análisis de los datos en dos etapas.

En primer lugar, como un paso de exploración, se puede seleccionar el Proceso de cuantiles para obtener una visión general y por lo tanto detectar algunos cuantiles de interés en los que centrarse en lo sucesivo.

Antes de empezar, recordamos los principales resultados de ANCOVA aplicado sobre este conjunto de datos:

Menu

Interpretación de los resultados del primer paso de la Regresión cuantil: cálculo del Proceso cuantil

En este paso preliminar solo se proporcionan resultados generales (dispondremos de más opciones en el segundo paso).

En primer lugar, podemos advertir que, alrededor de la mediana, los resultados son del mismo orden que los obtenidos en el ANCOVA (para la media):

Mean result

Ahora, si centramos nuestra atención en las variables edad (Age) y altura (Height), su contribución parece ser más fuerte en la evaluación del peso (Weight) de los niños más grandes (alfa > 0.9):

Mean result

en tanto que algunos otros resultados de la regresión cuantil sugieren que el género (Gender) tiene un mayor efecto sobre el peso en los niños más pequeños (alfa < 0.1):

Mean result

Obviamente, los cuantiles en los que estamos interesados pertenecen a los intervalos [0.9 , 1] y [0, 0.1].

Estas impresiones resultan también fáciles y rápidas de confirmar visualizando los gráficos ilustrativos que se ofrecen al final del análisis:

results

results

results

A continuación, en un segundo paso, se lleva a cabo la Selección de cuantiles: 0.95 y 0.05 en la hoja de Excel.

Interpretación de los resultados del segundo paso de la Regresión cuantil: cálculo del Proceso cuantil

La primera tabla muestra los coeficientes de bondad del ajuste del modelo para un cuantil específico. El valor R2 (coeficiente de determinación) indica el % de variabilidad de la variable dependiente que es explicada por las variables explicativas. Mientras más próximo sea R2 a 1, mejor es el ajuste.

results

En este caso concreto, el 91.6% de la variabilidad del peso (Weight) se explica por la altura (Height), la edad (Age) y el género (Gender). El resto de la variabilidad se debe a efectos (otras variables explicativas) que no han sido evaluados o que no pudieron ser medidos durante este experimento. Podemos suponer que están involucrados efectos genéticos y nutritivos, pero podría ser que simplemente mediante la transformación de las variables disponibles se podrían obtener mejores resultados.

Es importante examinar los resultados de la tabla de significación del modelo (véase más adelante). Los resultados nos permiten determinar si las variables explicativas aportan información significativa (hipótesis nula H0) al modelo. En otras palabras, es una manera de comprobar si es válido utilizar este cuantil para describir a toda la población, o si la información aportada por las variables explicativas resulta o no valiosa.

results

Se utilizan tres pruebas: Máxima Verosimilitud, Multiplicadores de Lagrange y Wald. Teniendo en cuenta el hecho de que la probabilidad asociada al valor Chi² es inferior a 0.0001, significa que estaríamos tomando un riesgo menor que 0.01% al asumir que la hipótesis nula (esto es, ausencia de efecto de las dos variables explicativas) fuera incorrecta. Por lo tanto, podemos concluir con seguridad que las tres variables aportan una cantidad significativa de información.

La siguiente tabla proporciona detalles sobre el modelo. Esta tabla es muy útil cuando se necesitan predicciones, o cuando es necesario comparar los coeficientes del modelo para una población dada con los obtenidos para la otra población.

results

La tabla siguiente muestra una parte de las predicciones y de los residuos. Nos permite examinar con más detenimiento cada uno de los residuos estandarizados.

results

El gráfico siguiente muestra los valores predichos contra los valores observados:

results

Conclusión de la Regresión cuantil

Como conclusión, la altura, la edad y el género nos permiten explicar más del 90% de la variabilidad de la variable peso. Una cantidad significativa de información es explicada por el modelo de regresión cuantil que hemos utilizado.

¿Ha sido útil este artículo?

  • No