Contrastes post ANOVA unifactorial en Excel
Este tutorial le enseñará cómo configurar e interpretar los contrastes subsiguientes a un Análisis de Varianza (ANOVA) unifactorial en Excel usando el software XLSTAT.
Datos para ejecutar un análisis de contraste subsiguiente a un ANOVA unifactorial
Descargar los datos
Los datos corresponden a un experimento de agronomía cuyo objetivo era comprobar los efectos de cuatro tratamiento (control, fertilizantes K, N y P) sobre la producción de maíz. Cada tratamiento se aplica dentro de ocho parcelas diferentes.
Objetivo de este tutorial
El propósito de este tutorial es contestar a preguntas muy específicas que deseamos hacer tras ejecutar un modelo lineal (un ANOVA unifactorial en nuestro caso) usando un análisis de contraste. Por ejemplo, podemos preguntarnos si un fertilizante es capaz de incrementar significativamente la producción de maíz dos o tres veces. Podemos asimismo someter a prueba la significación de las diferencias entre dos grupos disferentes de medias (¿incrementan los tres fertilizantes significativamente la producción media comparándola con la producción del grupo de control?) Es posible abordar estas preguntas utilizando un análisis de contrastes. Técnicamente, un contraste es una suma ponderada de los coeficientes de un modelo lineal. Comprobamos la diferencia entre estas suma y cero.
Unos pasos preliminares
Antes de ilustrar el concepto de los contrastes y de proceder con los análisis, recomendamos encarecidamente extraer los nombres de los coeficientes del modelo (ANOVA unifactorial, en nuestro caso) tal como son proporcionados por XLSTAT. Esos nombres pueden tomarse con facilidad en la hoja de resultados producida por un análisis ANOVA clásico en XLSTAT. Seleccione el comando XLSTAT / Modelado de datos / ANOVA, o bien haga clic en el botón correspondiente de la barra de herramientas Modelado de datos. Este tutorial puede ayudarle a lanzar el análisis. Configuración: variable dependiente = Yield; variable explicativa = Fertilizer.
En la hoja de resultados, eche un vistazo a la tabla Parámetros del modelo.
La primera columna (Fuente) contiene los nombres de los coeficientes del modelo tal como son definidos por XLSTAT. La segunda columna (Valor) incluye los valores de los coeficientes que estructuran la ecuación del modelo de más abajo, vinculando la variable explicativa (factor “Fertilizer”) con la variable dependiente (Yield). Por defecto, XLSTAT utiliza la media del primer nivel (en orden alfanumérico) del factor estudiado como nivel de referencia (Intercept). En nuestros datos, este nivel corresponde al Control. Los efectos se calculan como desviaciones entre las medias de los demás nivelse y la media del nivel de referencia. Por ejemplo, la desviación entre P y control es 26.90. Es significativamente diferente de cero con un riesgo alfa = 0.05 (p < 0.0001).
Advierta que el tipo de cálculo del efecto puede modificarse en XLSTAT en el comando ANOVA / pestaña Opciones / Restricciones. Una restricción an=0 usará el último nivel (P, en nuestro caso) como referencia. Una restricción sum(ai)=0 calculará las diferencias entre todos los niveles y la media general de los datos. La restricción menos frecuentemente usada sum(ni.ai)=0 permite además tomar en consideración el tamaño del grupo.
Análisis de contrastes, una aproximación conceptual
Conceptualmente, a fin de comprobar si el valor de un coeficiente es significativamente distinto de cero, podemos fijar todos los demás coeficientes en la ecuación del modelo a cero y comparar el valor resultante con cero.
Por ejemplo, si estamos interesados en el coeficiente FertilizerN, la ecuación del modelo podría escribirse de esta forma:
0 x Intercept + 0 x FertilizerC + 0 x FertilizerK + FertilizerN + 0 x FertilizerP (1)
= FertilizerN
= 67.038
Este valor es probado contra cero, y en nuestro caso es significativo (valor p < 0.0001).
Considere la ecuación (1) y multiplique FertilizerN por 1:
0 x Intercept + 0 x FertilizerC + 0 x FertilizerK + 1 x FertilizerN + 0 x FertilizerP (1)
La combinación de números que multiplican cada coeficiente en una prueba particular es un contraste. Aquí, denominamos de forma arbitraria a nuestro contraste Cont1, y lo escribimos del siguiente modo:
Cont1: 0 0 0 1 0
El contraste que pone a prueba el coeficiente FertilizerP puede ser definido de este modo:
Cont2: 0 0 0 0 1
Podemos definir un contraste para someter a prueba si la producción total de las parcelas fertilizadas con el fertilizante K es significativamente diferente de cero. Por consiguiente, calculamos la suma entre el nivel de referencia (Intercept) y la desviacíon explicada por el fertilizante K (coeficiente FertilizerK) y para probar si esta suma es significativamente diferente de cero. El contraste se escribe del modo siguiente:
Cont3: 1 0 1 0 0
Podemos preguntar si la mejora en la producción del fertilizante N es al menos dos veces tan importante como la mejora proporcionada por el fertilizante P. Esto se representa mediante una diferencia positiva y significativa FertilizerN – 2 x FertilizerK. El siguiente contraste traslada esta diferencia:
Cont4: 0 0 0 1 -2
Además, podemos estar interesados en la mejora de la producción media proporcionada por los tres fertilizantes (K, N y P) en comparación con la producción de control. Esta pregunta puede abordarse calculando el promedio entre las desviaciones del fertilizante y probando su significación. Matemáticamente, este promedio se escribe de este modo:
(FertilizerK + FertilizerN + FertilizerP)/3 = 0.33 x FertilizerK + 0.33 x FertilizerN + 0.33 x FertilizerP
El contraste equivalente:
Cont5: 0 0 0.33 0.33 0.33
Finalmente, podemos preguntarnos si en fertilizante N mejora la producción control al menos el doble. Matemáticamente, esto puede someterse a prueba comprobando si el valor definido por la difernecia entre la producción promedia de las parcelas fertilizadas por N y dos veces la producción media de las parcelas control es positiva y significativa. Usando los coeficntes del modelo, podemos trasladarlo a esta ecuación:
Average(N-fertilized plots) – 2 x average(Control plots)
= Intercept + FertilizerN – 2 x (Intercept + FertilizerControl)
= FertilizerN – Intercept
El contraste equivalente:
Cont6: -1 0 0 1 0
Cómo hacerlo en XLSTAT
En la hoja de resultados ANOVA, copiamos la columna que contiene los nombres de los coeficientes y la pegamos en la hoja de datos. Este paso no es obligatorio, pero facilita la definición de los contrastes.
Escribimos los contrastes deseados en columnas a continuación de los coeficientes (una columna por contraste). En este tutorial, consideramos los 6 contrastes definidos más arriba.
Para mejorar la legibilidad, incluimos los nombres de los contrastes entima de las columnas de los contrastes.
Configuramos el mismo ANOVA descrito más arriba, añadiendo opciones incluidas en la pestaña Resultados / Contrastes: marcamos la caja Calcular contrastes y seleccionamos la matriz de contrastes, incluyendo los nombres de las columnas pero excluyendo los coeficientes. Hacemos clic en el botón OK.
La tabla de análisis de los contrastes aparece en la parte inferior de la hoja de resultados.
Cada contraste se define mediante un valor que corresponde a la cantidad sometida a prueba que se ha calculado en la ecuación del contraste. Esta cantidad se asocia a un error estándar y a límites inferior y superior de un intervalo de confianza al 95%. Finalmente, el estadístico t asociado a un valor p nos permite someter a prueba si la cantidad es significativemnte diferente de cero.
Aquí presentamos un resumen de las preguntas que hemos hecho en el párrafo anterior y las respuestas que proporcionamos a través del análisis de los contrastes:
Cont1:¿Es la desviación entre el fertilizante N y el control significativa con alfa = 0.05?
Respuesta: sí (p < 0.0001).
Cont2: ¿Es la desviación entre el fertilizante P y el control significativa con alfa = 0.05?
Respuesta: sí (p < 0.0001).
Cont3: ¿Cuál es la producción media de las parcelas sometidas a un fertilizante K? ¿Es esta producción significativamente diferente de cero con alfa = 0.05?
Respuesta: producción media = 73.938, significativamente diferente de cero (p < 0.0001).
Cont4: ¿Es la mejora en la producción N al menos dos veces más importante que la mejora con P con alfa = 0.05?
Respuesta: sí, porque el valor del contraste resultante es positivo (+13.238) y significativo (p < 0.05).
Cont5: ¿Cuál es el incremento de producción medio proporcionado por los tres fertilizantes (K, N y P) comparado con la producción control? ¿Es este incremento significativo con alfa = 0.05?
Respuesta: Mejora = 30.958, significativamente diferente de cero (p < 0.0001).
Cont6: ¿Mejora el fertilizante N al menos dos veces la producción total comparado con la producción control con alfa = 0.05?
Respuesta: la diferencia entre la producción de las parcelas fertilizadas con N y dos veces la producción de las parcelas control no es significativa (p > 0.05).
Un paso más
Los contrastes pueden definirse sobre modelos lineales de complejidad variable (e.g., ANOVA multinivel con interacciones, ANCOVA, etc.) En modelos que incluyen variables explicativas cuantitativas, es por consiguiente posible manipular coeficientes que corresponden a las pendientes o a desviaciones de las pendientes.
¿Ha sido útil este artículo?
- Sí
- No