PRESENTACIÓN DE LOS MÉTODOS DE ANÁLISIS FACTORIAL DE
CORRESPONDENCIAS
SIMPLES Y MÚLTIPLES ÍNDICE
PRIMERA PARTE Análisis Factorial de Correspondencias Simples A. OBSERVAR, CONSERVAR Y RESUMIR LAS OBSERVACIONES
1. Observar para comparar 2. Resumir ➜ perder información 3. Evaluación de las comparaciones : similitudes, disimilaridades y distancias
B. COMPARAR Y COMUNICAR EL RESULTADO DE LAS COMPARACIONES
1. El tratamiento estadístico produce un «mensaje» 2. Componentes y modalidades del mensaje
C. VENTAJAS E INCONVENIENTES DE LOS MODOS ANALÓGICO Y DIGITAL DE COMUNICACIÓN DE UN MENSAJE
1. Comunicación de la información de una Tabla de Contingencia 2. Representación gráfica de la información : índices de similitud y distancias
D. REPRESENTACIÓN GRÁFICA DE LA TABLA DE CONTINGENCIA
1. La Tabla de Contingencia y la Tabla de Frecuencias Relativas asociada 2. Presentación de un ejemplo numérico a) Primera representación gráfica b) Segunda representación gráfica c) Tercera representación gráfica d) Inconvenientes de esos modos de representación de la información
E. REPRESENTACIÓN DE UNA TABLA DE CONTINGENCIA EN UN ESPACIO EUCLIDIANO
1. Espacios de representación 2. Modo analógico de representación de la Tabla de Contingencia en un espacio euclidiano
3. Modo digital de resumir la información de la tabla T 4. Distorsión de la información contenida en la tabla T 5. Representación de la tabla F(3 x 3) en un espacio euclidiano 6. Definición del modo digital de resumir la información de la Tabla F 7. La Tabla F «conserva» la información 8. Distorsión de la información de la Tabla F 9. Representación de la información en términos de comparación de perfiles a) Definición de los perfiles de los elementos de la Tabla T b) Definición de los perfiles de la tabla F c) Representación de la información en términos de comparación de perfiles d) Representación gráfica (analógica) de la información de las tablas de perfiles e) Representación digital de la información de las tablas de perfiles f) Representación gráfica de la información contenida en una Tabla de Contingencia 10. Relación entre la información de las tablas de perfiles y la información de la tabla F 11. Distorsión de la información aportada por las Tablas de Perfiles
F. REPRESENTACIÓN Y COMPARACIÓN DE PERFILES -PONDERADOS 1. Comparación de perfiles-ponderados 2. Evaluación de la comparación de perfiles : distancia del Chi2 3. Espacios de representación con la distancia del Chi2 4. Propiedad de la distancia del Chi2 : equivalencia distribucional 5. Resumen
G. REPRESENTACIÓN DE LA INFORMACIÓN EN TÉRMINOS DE INERCIA DE UNA NUBE DE PUNTOS
1. Inercia de una nube de puntos-perfiles dotados de peso 2. Contribución a la inercia con respecto a m del punto i 3. Inercia con respecto a G de una nube de puntos-perfiles dotados de peso 4. Desvío a la situación de independencia : asociación de dos variables cualitativas 5. La inercia de las nubes N(I) y N(J), con respecto al punto G 6. Los puntos perfiles-marginales G son los Centros de Gravedad de los sistemas de masa
7. Lectura de la información de una Tabla F(I, J) asociada a la Tabla T(I, J) 8. Resumen
H. DEFINICIÓN DE UN NUEVO REFERENCIAL DE REPRESENTACIÓN
1. Forma de los espacios de los puntos-perfiles ponderados e independencia de las variables cualitativas 2. Descomposición de la inercia de las nubes de puntos con respecto al origen 3. Inercia de las nubes de puntos perfiles con respecto a un punto m cualquiera 4. Importancia de la descripción de la forma de las nubes de puntos centradas en G 5. El punto G de una nube de puntos-perfiles es un punto característico del espacio 6. Reducción de una nube de puntos-perfiles al Centro de Gravedad
I. DEFINICIÓN DE UN NUEVO REFERENCIAL DE REPRESENTACIÓN DE UNA
TABLA DE CONTINGENCIA 1. ¿Cómo hacer para construir un sistema de ejes ortogonales...? 2. Referencial ortogonal y centrado en GJ
3. ¿Cómo construir una «buena» representación de la información de la Tabla T...? 4. ¿Cómo elegir entre esos dos sistemas de ejes igualmente posibles...? 5. Proceso de construcción del nuevo referencial 6. ¿Cómo se calculan las rectas que constituyen el nuevo referencial...?
J. REPRESENTACIÓN FACTORIAL DE LA INFORMACIÓN APORTADA POR UNA
TABLA DE CONTINGENCIA 1. Propiedades de los factores de una nube de puntos-perfiles a) Coordenadas de los puntos-perfiles b) Coordenadas del Centro de Gravedad c) Varianza de los factores d) Significado de los valores propios de una matriz de inercia e) ¿Qué significa un valor propio λα = 1...? f) ¿Cuáles son los valores propios (y los ejes factoriales) pertinentes de un análisis...? g) Tasa de inercia de un factor h) Tasa de inercia de un plano factorial i)
La representación factorial de las nubes de puntos N(I) y N(J) conserva la información de la tabla T
2. Componentes digitales del mensaje a) Contribución de los puntos-perfiles a la inercia a lo largo de un eje factorial b) Calidad de representación de un punto-perfil a lo largo de un eje factorial c) Significado del coeficiente de calidad de representación de un punto-perfil sobre un eje factorial d) Significado del coeficiente de calidad de representación de un punto-perfil sobre un plano factorial 3. Representación conjunta de la inercia de las nubes de puntos N(I) y N(J) a) Justificación de la representación conjunta b) Fórmulas de Transición c) Significado de las Fórmulas de Transición 4. Elementos suplementarios o ilustrativos en un análisis a) Empleo de elementos suplementarios b) Coordenadas de los elementos suplementarios c) Coeficientes de ayuda a la interpretación de los elementos suplementarios 5. Valores test 6. Fórmula de reconstrucción de los datos 7. Esquema del proceso de transformación de los datos
K.
UN EJEMPLO DE APLICACIÓN DEL ANÁLISIS FACTORIAL DE CORRESPONDENCIAS SIMPLES 1. Objetivo del estudio 2. Tabla de Datos : resumen de las observaciones 3. Tabla de Contingencia : deducida de la Tabla de Datos observada 4. Tabla F : asociada a la Tabla de Contingencia 5. Tabla de Perfiles-líneas : asociada a la Tabla T 6. Lectura de un perfil-línea 7. Lectura de un perfil-columna 8. Tabla de Perfiles-columnas : asociada a la tabla T 9. Columnas de la Tabla T («variables») 10. Descomposición de la inercia de la Tabla T 11. Coordenadas, Contribuciones y Cosenos Cuadrados de los Puntos-Perfiles líneas y columnas 12. Primer Plano Principal : Nube de puntosperfiles líneas 13. Primer Plano Principal : Nube de puntosperfiles columnas 14. Primer Plano Principal : representación conjunta
15. Gráfico de la tabla de perfiles-línea. 16. Gráfico de la tabla de perfiles-línea, con un ancho de columna proporcional al peso de la modalidad en columna. 17. Gráfico de la tabla de perfiles-columna. 18. Gráfico de la tabla de perfiles-columna, con un ancho de columna proporcional al peso de la modalidad en línea. 19. Gráfico de la tabla de perfiles-ponderados, con las líneas y columnas ordenadas según el score de los mismos en el primer eje factorial.
SEGUNDA PARTE Análisis Factorial de Correspondencias Múltiples L.
GENERALIZACIÓN DEL A.F.C. : ANÁLISIS FACTORIAL DE CORRESPONDENCIAS MÚLTIPLES 1. Introducción 2. Tablas estadísticas de resumen de la observación 3. Tablas de Códigos Condensados 4. Tablas Lógicas
5. Tabla Disyuntiva Completa 6. Tabla de Burt
M.
OBJETIVOS DEL ANÁLISIS FACTORIAL DE CORRESPONDENCIAS MÚLTIPLES
N.
ANÁLISIS FACTORIAL DE CORRESPONDENCIAS DE UNA TDC(n x K) 1. Distancia entre «individuos» (líneas) de una TDC(n x K) 2. Distancia entre modalidades (columnas) de una TDC(n x K)
O.
DEFINICIÓN DE UN NUEVO REFERENCIAL DE REPRESENTACIÓN DE N(I) Y N(J): LOS EJES FACTORIALES
1. Inercia total con respecto al Centro de Gravedad de la nube de puntos N(J) 2. Relaciones de Transición 3. Estudio de las variables en el análisis de una TDC(n x K) a) Relación entre una variable cualitativa y un factor del análisis de una TDC (n x K) b) ¿Cómo evaluar el grado de asociación existente entre la variable J y el eje α ...?
P.
A.F.C. DE UNA TABLA DE BURT 1. Análisis Factorial de Correspondencias de la TB(K x K) y de la TDC(n x K) 2. Semejanzas y diferencias del A.F.C.M. de una TB(K x K) y de una TDC(n x K)
Q.
COMPONENTES DIGITALES DEL ANÁLISIS DE LA INFORMACIÓN DE LA TDC (O DE LA T.B.) 1. Coeficientes de ayuda a la selección de ejes factoriales 2. Coeficientes de ayuda a la interpretación de los ejes factoriales
R.
ELEMENTOS SUPLEMENTARIOS EN UN A.F.C.M. 1. Individuos suplementarios 2. Atributos suplementarios 3. Modalidades suplementarias 4. Utilización de elementos suplementarios
S.
UN INSTRUMENTO DE CARACTERIZACIÓN DE LOS EJES FACTORIALES: LOS « VALORES DE PRUEBA» 1. Los «valores de prueba» : instrumento de exploración de tablas de gran tamaño
2. Variables cuantitativas características de una clase 3. Atributos típicos de una clase
T.
EJEMPLO DE APLICACIÓN DEL MÉTODO DE ANÁLISIS FACTORIAL DE CORRESPONDENCIAS MÙLTIPLES Estudio de la relación Precio/Características de los vehículos disponibles en el mercado en 1993 -
Tabla de datos
-
Estrategias posibles de resolución del problema
Primera opción : [ACP + Clasificación] de la Tabla T(93,14) -
a)
Comparación de los modelos de vehículos considerando únicamente las variables cuantitativas disponibles. Selección de variables Etapas de análisis Análisis de Componentes Principales
-
Estadísticas de las variables continuas de T(93,14)
-
Matriz de correlaciones
-
Descomposición de la inercia Gráfico del Primer Plano Principal: nube de puntos-vehículos Nube de puntos-vehículos en tres dimensiones
-
-
Coordenadas, Contribuciones y Cosenos Cuadrados de los ind. sobre los ejes I y II Gráfico del Primer Plano Principal: variables activas
-
Coordenadas de las variables sobre los ejes I a III
-
Coordenadas y valores-test de las modalidades sobre los ejes I a III Gráfico del Primer Plano Principal: nube de puntos-vehículos y modalidades de las variables categoriales ilustrativas Gráfico del Primer Plano Principal: variables activas e ilustrativas
-
-
(Antes de abordar las secciones (b), (c) y (d) de este ejercicio de aplicación le aconsejamos consultar las notas del curso de E. CRIVISQUI «Métodos de Clasificación» § Primera Parte y § Segunda Parte) b) -
Clasificación Jerárquica de los vehículos Descripción de los nodos
-
Descripción de los nodos de la jerarquía Dendrograma
c)
Partición por corte del árbol en 4 clases
-
Descripción elemental de la partición Consolidación de la partición en torno a 4 Centros de Clases
-
Descomposición de la inercia calculada sobre los 5 primeros ejes factoriales
-
Elementos parangones de cada clase
-
Elementos de máxima contribución a la inercia intra clase
-
Nube de puntos-vehículos : disposición espacial de las clases de la partición
-
Gráfico del Primer Plano Principal: variables activas y Centros de Clases de la partición
d)
Descripción de la partición
-
Evaluación de resultados
Segunda opción : [AFCM + Clasificación] de la Tabla T(93,14) -
Comparación de los modelos de vehículos considerando todas las variables disponibles (cuantitativas y categoriales).
-
Discretización de las variables continuas Selección de variables
-
Etapas de análisis
a) Análisis de Correspondencias Múltiples - Distribución de frecuencias de las variables activas - Tabla de Burt (perfiles en línea) -
Descomposición de la inercia asociada a la tabla TCC (93,74)
-
Primer Plano Principal : Nube de puntos-vehículos Nube de puntos-vehículos en tres dimensiones
-
-
Coordenadas, Contribuciones y Cosenos Cuadrados de las modalidades activas Primer Plano Principal : Nube de puntosmodalidades activas
-
Coordenadas y Valores-test de las modalidades ilustrativas
-
Primer Plano Principal : Nube de puntosmodalidades activas e ilustrativas
(Antes de abordar las secciones (b), (c) y (d) de este ejercicio de aplicación le aconsejamos consultar las notas del curso de E. CRIVISQUI «Métodos de Clasificación» § Tercera Parte) b) Clasificación Jerárquica de los vehículos - Descripción de los nodos de la jerarquía -
Dendrograma
c) Partición por corte del árbol en 4 clases - Descripción elemental de la partición -
Descomposición de la inercia calculada sobre los 5 primeros ejes factoriales Elementos parangones de cada clase Elementos de máxima contribución a la inercia intra clase Nube de puntos-vehículos : disposición espacial de las clases de la partición en 4 clases. Nube de puntos-vehículos : disposición espacial de las clases de la partición en 5 clases.
d) Descripción de la partición en 4 clases -
Evaluación de resultados
U.
RESÚMEN DE LA ESTRATEGIA DE INTERPRETACIÓN DE RESULTADOS
1. Un análisis eficaz = definición pertinente de la T.C.C. 2. Primera etapa : Estudio de la inercia asociada a los factores 3. Segunda etapa : Interpretación de los ejes y planos factoriales 4. Tercera etapa : Estudio de las variables 5. Cuarta etapa : Coordenadas y contribuciones de los elementos activos 6. Quinta etapa : Interpretación de los planos factoriales 7. Sexta etapa : Interpretación de los elementos suplementarios
V.
CONCLUSIÓN: COMENTARIOS SOBRE LA PRÁCTICA DE LOS MÉTODOS DE ANÁLISIS FACTORIAL