Regresión loglineal (Poisson): tutorial Excel
Este tutorial le mostrará cómo configurar e interpretar una Regresión Log-Lineal, también denominada Regresión de Poisson en Excel usando el software XLSTAT.
¿No está seguro de que esta sea la función de modelado que está buscando? Consulte por favor esta guía.
Datos para una regresión log-lineal (regresión de Poisson)
Los datos corresponden al número de recompensas ganadas por los estudiantes en un instituto. Para explicar el número de recompensas ganadas, tenemos dos predictores: el tipo de programa en el que estudiante estaba matriculado (e.g., vocacional, general o académico) y la puntuación en el examen final de matemáticas.
Puesto que tenemos datos de frecuencias, usaremos una regresión log-lineal con distribución de Poisson para explicar y/o predecir el número de recompensas ganadas por un estudiante.
Configuración de una regresión log-lineal
Tras abrir XLSTAT, seleccione el comando XLSTAT / Modelación de datos / Regresión Log-lineal, o bien haga clic sobre el botón correspondiente de la barra de herramientas Modelación de datos.
Tras hacer clic en el botón, aparece el cuadro de diálogo.
Los datos se presentan en una tabla de 200 filas y 3 columnas. La primera es la variable de respuesta y las otras dos son las variables explicativas.
En la pestaña Opciones, pueden modificarse varios criterios sobre el algoritmo. Es asimismo posible añadir interacciones entre las variables. Aquí elegimos dejar todas las opciones en sus valores predeterminados.
Los cálculos comienzan tras hacer clic en OK. Los resultados se muestran a continuación en una nueva hoja.
Interpretación de los resultados
Los primeros resultados que se muestran son los estadísticos de cada variable. La variable dependiente se representa en color azul. La siguiente tabla muestra varios indicadores de la calidad del modelo (o bondad de ajuste). Estos resultados son equivalentes a la R2 y a la tabla de análisis de varianza de regresión lineal y ANOVA. El valor más importante a tener en cuenta es la probabilidad de que la prueba de Chi-cuadrado de la relación de sobre la log ratio. Esto equivale a la prueba F de Fisher: intentamos evaluar si las variables contienen información comparando el modelo tal como está definido con un modelo más simple con una sola constante. En este caso, puesto que la probabilidad es inferior a 0.0001, concluimos que las variables contienen información significativa.
La tabla siguiente proporciona el valor estimado de los coeficientes para el modelo ajustado. Para evaluar si una variable contiene información significativa, se muestra una prueba estadística. En nuestro caso, advertimos que el parámetro del “Programa General” no difiere significativamente de 0 (al nivel del 5%).
El último paso es la aplicación del modelo a la población general.
¿Ha sido útil este artículo?
- Sí
- No