Pasar al contenido principal

Comparar k proporciones: tutorial en Excel

Este tutorial le mostrará cómo comparar varias proporciones observadas mediante la prueba de k proporciones, en Excel con XLSTAT.

¿No está seguro de si esta es la prueba estadística que busca? Consulte por favor esta guía.

Comparación de k proporciones

Una proporción es una manera de medir, en una escala [0, 1], el número de observaciones que pertenecen a una categoría determinada, en comparación con el tamaño total de la población. Se calcula como la ratio entre el número de observaciones que pertenecen a la categoría de interés y el tamaño total de la población.
Para comparar k proporciones, los métodos estadísticos requieren conocer los tamaños de la población. Así, los datos de entrada pueden ser o bien las proporciones y los correspondientes tamaños de la población, o el número de observaciones que pertenecen a la categoría de interés, y los correspondientes tamaños de población.
Datos para comparar k proporciones
Los datos corresponden a 6 series diferentes de tornillos utilizados en coches de rally. El número de tornillos que pasan las pruebas de calidad corresponde a “Éxito” y el otro a “Fracaso”.
Nuestro objetivo es determinar si la calidad de las 6 series se puede considerar como diferente o no y, si hubiera una diferencia, se desea determinar si hay una o más series responsables de la diferencia, con el fin de hacer los ajustes necesarios para las producciones ulteriores.

Configuración de una prueba para comparar k proporciones

Una vez abierto XLSTAT, seleccionar el comando XLSTAT / Pruebas paramétricas / Comparación de k proporciones en el menú XLSTAT, o bien hacer clic en el botón correspondiente de la barra de herramientas Pruebas paramétricas (véase siguiente captura de pantalla).

barkprop.gif

Una vez haya hecho clic en el botón, aparece el cuadro de diálogo. Seleccione los datos en la hoja de cálculo de Excel.

Seleccione primero las frecuencias de Éxito (columna B), y luego el Tamaño de las muestras (columna D), que son aquí el número total de tornillos producidos en una serie dada.

Seleccionamos asimismo las Etiquetas de las muestras (columna A). Se seleccionan todas las pruebas. Se activa la opción Etiquetas de las columnas, puesto que la primera fila de los datos seleccionados contiene la cabecera de las columnas.

kprop1.gif

Los cálculos empiezan una vez haya hecho clic en OK.

Interpretación de los resultados de una prueba de comparación de k proporciones

Los primeros resultados corresponden a la prueba de Chi-cuadrado. La prueba de Chi-cuadrado se utiliza en tablas de contingencia para probar si las columnas y las filas son independientes. En este caso particular en que estamos estudiando, un evento binario (éxito / fracaso), la independencia de filas y columnas equivale a que no hay diferencia entre las proporciones de éxitos en las series. XLSTAT reconstruye automáticamente la tabla de contingencia a partir de los datos de entrada.

La prueba de Chi-cuadrado llega a la conclusión de que hay que hay al menos una serie que se diferencia de las demás. Sin embargo, nos damos cuenta de que el valor p es muy cercano al nivel de significación.

kprop2.gifSabemos que la prueba de Chi-cuadrado es una prueba asintótica que no debería utilizarse cuando demasiadas celdas de la tabla de contingencia contienen valores bajos. Como este es el caso aquí, se recomienda ejecutar la prueba basada en simulaciones (prueba de Monte Carlo). El principio es generar muchas tablas de contingencia al azar que tengan las mismas sumas marginales y calcular las distancias chi-cuadrado en estas tablas. A continuación, se determina cuántas tablas rinden valores chi-cuadrado más bajos para que podamos ver cuán “extrema” es nuestra tabla.

kprop3.gif

Vemos que la prueba de Monte Carlo con 5000 simulaciones da casi el mismo resultado que la prueba de Chi-cuadrado, y confirma el hecho de que al menos una serie es diferente de las otras.

Con el fin de identificar qué serie es diferente, se utiliza el procedimiento de Marascuilo. Los resultados se muestran a continuación.

kprop4.gif

Vemos que las dos series más diferentes son S2 y S3. Puesto que S2 no es diferente de las otras series, se concluye que la serie que S3 es responsable del rechazo de la hipótesis H0 en la prueba de k proporciones. Las razones por las cuales la producción S3 tiene una mejor calidad deberían investigarse con más detenimiento.

¿Ha sido útil este artículo?

  • No