Filtrado de observaciones dentro de ACP
Este tutorial muestra cómo mejorar la legibilidad de los gráficos de los Análisis de Componentes Principales (ACP) eliminando las variables u observaciones menos importantes.
Datos para ejecutar un análisis de componentes principales
Los datos provienen de la Oficina del Censo de los Estados Unidos (US Census Bureau) y describen los cambios en la población de 51 estados entre 2000 y 2001. La base de datos inicial ha sido transformada a tasas por 1000 habitantes, utilizando los datos de 2001 como foco para el análisis. Estamos interesados en estudiar los estados grandes (con una población mayor que el promedio). Se ha añadido una variable de tamaño (grande/pequeño).
Objetivo del análisis de componentes principales
Nuestro objetivo es analizar las correlaciones entre las variables, y encontrar si los cambios en población en algunos estados son muy diferentes de los encontrados en otros estados. Centramos nuestra atención en los estados grandes usando la opción de filtrado de XLSTAT. La única diferencia entre este tutorial y el tutorial disponible aquí, es que decidimos estudiar únicamente los estados grandes
Configuración de un análisis de componentes principales
Una vez activado XLSTAT, seleccione el comando XLSTAT / Análisis de datos / Análisis de componentes principales, o bien haga clic en el botón correspondiente de la barra de herramientas Análisis de datos (véase más abajo).
Aparece el cuadro de diálogo del Análisis de Componentes Principales.
Seleccione los datos en la hoja de Excel. Se elige Observaciones/variables como Formato de datos, debido al formato de los datos de entrada.
El tipo de ACP que se usará durante los cálculos es la matriz de correlaciones de Pearson, que corresponde a los coeficientes de correlación clásicos.
En la pestaña Opciones de los datos, seleccionamos la opción Filtrar y seleccionamos la columna Tamaño en la base de datos.
En la pestaña Gráficos, deseamos que aparezcan todos los estados grandes y, por tanto, no activamos la opción de filatrado.
Haga clic en OK. Se muestra un nuevo cuadro de diálogo preguntando qué grupo desea incluir. Seleccione el grupo grande y haga clic en OK.
Los cálculos comienzan tras hacer clic en OK. Se le pide que confirme el número de filas y columnas.
A continuación, debería confirmar los ejes en los que desea que se muestren los gráficos. En este ejemplo, el porcentaje de variabilidad representada por los dos primeros factores no es muy alta (72.09%); para evitar una interpretación errónea de los resultados, hemos decidido complementar los resultados con un segundo gráfico sobre los ejes 1 y 3.
’’’’
Interpretación de los resultados de un análisis de componentes principales aplicado a datos filtrados
Se muestran los resultados para los estados más grandes. La primera tabla proporciona
A continuación de muestran los valores propios.
We are interested in the maps for variables and observations. Regarding variables we have the following map:
Podemos ver que en el primer eje los estados más antiguos se oponen a los estados más jóvenes. El segundo eje opone los estados con altas tasas de migración doméstica a los estados con tasas de migración doméstica más bajas.
En lo que atañe a las observaciones, tenemos el siguiente mapa.
Esta sencilla herramienta le permite filtrar las observaciones directamente desde el cuadro de diálogo ACP y evitar una manipulación compleja de los datos.
¿Ha sido útil este artículo?
- Sí
- No