Story Transcript
ÁNALISIS BIVARIADO
Estudiar la relación entre dos variables cualitativas
ÁNALISIS BIVARIADO
Estudiar la relación entre dos variables cualitativas
ANALISIS DE FRECUENCIAS, INDEPENDENCIA ANALISIS DE FRECUENCIAS, INDEPENDENCIA
Estudiar la relación entre dos variables cuantitativas CORRELACIÓN Y REGRESIÓN LINEAL
Ø Frecuencias, tabla de contingencia Ø Prueba de asociación/independencia χ2 Ø Gráficos de barras
Estudiar la relación entre una variable cuantitativa y una variable cualitativa COMPARACIÓN DE MEDIAS
ANÁLISIS DE FRECUENCIAS Resumir los valores observados de dos variables cualitativas, es el resultado de clasificar a los sujetos según los valores de las dos variables. Describir la distribuci ón de frecuencias de una de las variables (var respuesta) en cada categoría de la otra variable (var explicativa)
Tabla de 2x2
En el caso más simple de dos variables categóricas, las frecuencias de interés son las que forman la tabla de 2x2: intervención
1
1 n11
2 n 12
n1.
2
n21
n22
n2 .
n.1
n.2
N
Ejemplo: Resultado de una intervenci ón (sí/no) y sexo (hombre/mujer) ¿La proporci ón de curados es igual en hombres y mujeres, es decir es independiente del sexo, o por el contrario se asocia al sexo, de manera que la proporci ón de curados es mayor en hombres que en mujeres?
Contraste de hipótesis: H0: El resultado de la intervención no se relaciona con el sexo H1: El resultado de la intervención sí se relaciona con el sexo
H0: Las dos variables son independientes
sexo
Prueba ji-cuadrado: χ2 Las pruebas de hipótesis sobre proporciones pueden reformularse como pruebas sobre el número de casos observados respecto a los esperados cuando H0 es cierta
H1: Las dos variables no son independientes
1
1 n11
1 2
2 n12
CASOS OBSERVADOS
n1.
n21
n22
n2.
n.1
n.2
n..
esperados =
Observados
ni . * n. j n ..
Tabla de contingencia SEXE Sexe de l'entrevistat * BRONQ Bronquitis crònica BRONQ Bronquitis crònica .00 No 1.00 bronquític Bronquític SEXE Sexe de 1 Home Recuento l'entrevistat Frecuencia esperada 2 Dona
Frecuencia esperada Total
74
181
62.8
181.0
132
53
185
120.8
64.2
185.0
Recuento Frecuencia esperada
Recuento BRONQ Bronquitis crònica .00 No bronquític
1.00 Bronquític
SEXE Sexe de 1 Home l'entrevistat 2 Dona
107
74
181
132
53
185
Total
239
127
366
Total
Ejercicio
Total
107 118.2
Recuento
Tabla de contingencia SEXE Sexe de l'entrevistat * BRONQ Bronquitis crònica
239
127
366
239.0
127.0
366.0
e11 =
n1. * n .1 181*239 = = 118,2 366 n ..
e12 =
n 1. * n .2 181*127 = = 62,8 366 n ..
e 21 =
n 2. * n .1 185*239 = = 120,8 366 n ..
e 21 =
n 2. * n .2 185*127 = = 64,2 366 n ..
¿Es independiente el sexo de la autopercepción de la salud (recodificar la percepción de la salud en 2 categorías (EX+MB+B y R+M)?. Calcular el valor esperado e 21
CASOS ESPERADOS
e21 = Construir la tabla 2x2:
n2. * n .1 185 * 263 = = 132 ,94 n.. 366 Tabla de contingencia sexo Sexo del entrevistado * salud2 salud2 sexo Sexo del entrevistado
Tabla de contingencia sexo Sexo del entrevistado * salud2 Recuento salud2 ,00 Ex+MB+B sexo Sexo del 1 Hombre entrevistado 2 Mujer
139
Total
1,00 R+M
2 Mujer
Total
42
181
124
61
185
263
103
366
Total
,00 Ex+MB+B 139
1,00 R+M 42
Frecuencia esperada
130,1
50,9
181,0
% de sexo Sexo del entrevistado
76,8%
23,2%
100,0%
% de salud2
52,9%
40,8%
49,5%
% del total
38,0%
11,5%
49,5%
124
61
Frecuencia esperada
132,9
52,1
185,0
% de sexo Sexo del entrevistado
67,0%
33,0%
100,0%
% de salud2
47,1%
59,2%
50,5%
% del total
33,9%
16,7%
50,5%
263
103
Frecuencia esperada
263,0
103,0
366,0
% de sexo Sexo del entrevistado
71,9%
28,1%
100,0%
100,0%
100,0%
100,0%
71,9%
28,1%
100,0%
1 Hombre Recuento
Recuento
Recuento
% de salud2 % del total
Total 181
185
366
2
Estadístico de contraste χ2 : Chi-Square Tests
χ2 = ∑ (o-e)2 ~ χ 2(f-1)*(c-1) e o = frecuencia observada casilla e = frecuencia esperada, si H0 cierta (f-1)*(c-1) = grados de libertad
Pearson Chi-Square a
Continuity Correction Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association
Ejemplo: χ2 =
N of Valid Cases
(139 − 130,1) 2 ( 42 − 50,9 ) 2 (124 − 132,9 ) 2 ( 61 − 52,1) 2 + + + = 4,32 130,1 50,9 132,9 52,1
1 1
Asymp. Sig. (2-sided) ,038 ,050
4,337
1
,037
4,305
1
,038
Value b 4,317 3,848
df
Exact Sig. (2-sided)
Exact Sig. (1-sided)
,048
,025
366
a. Computed only for a 2x2 table b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 50,94.
¿Qué hacer si no se cumple? Propiedades test χ2
1. Se pueden agrupar las categorías (pero con sentido!!!!)
Es siempre a 2 colas (se pierde el signo de las diferencias) Usa una aproximación normal, por lo que deben cumplirse ciertas condiciones: Ø Como m áximo 20% de las frecuencias esperadas pueden ser < 5 Ø No debe usarse si hay frecuencias E < 1
2. Corrección de continuidad de Yates - Está muy discutido su uso - Hay quien dice que debe usarse siempre, porque es una corrección conservadora pero hay argumentos importantes en su contra -SPSS proporciona los 2 test para elegir 3. Test exacto de Fisher
SPSS: TABLA DE CONTINGENCIA
TABLA DE CONTINGENCIA
Analizar → Estadísticos descriptivos → Tablas de contingencia
El análisis de frecuencias basado en tablas de contingencia puede generalizarse a variables con m ás de 2 categorías: (r x k) Tabla de contingencia ESTADO SALUD * SEXO Recuento SEXO Hombre ESTADO SALUD
Mujer 63
142
236
258
494
Regular
50
100
150
Dolenta
9
16
25
Molt dolenta
3
2
5
Bona
NS/NC Total
Total
79
Molt bona
377
1
1
440
817
3
SPSS: TABLA DE CONTINGENCIA, CASILLAS
SPSS: TABLA DE CONTINGENCIA, CASILLAS Tabla de contingencia ESTADO SALUD * SEXO SEXO Hombre ESTADO SALUD
Molt bona
Recuento
Regular
142
44,4%
100,0%
% de SEXO
21,0%
14,4%
17,4%
7,7%
17,4%
236
258
494
47,8%
52,2%
100,0%
% de SEXO
62,6%
58,8%
60,5%
% del total
28,9%
31,6%
Recuento
60,5%
50
100
150
% de ESTADO SALUD
33,3%
66,7%
100,0%
% de SEXO
13,3%
22,8%
18,4%
6,1%
12,3%
Recuento
% de SEXO % del total Recuento % de ESTADO SALUD % de SEXO % del total Total
9,7%
% de ESTADO SALUD
% de ESTADO SALUD
Molt dolenta
Porcentajes que calculará para cada casilla
Recuento
% del total Dolenta
Total 63
55,6%
% del total Bona
En la casilla puede mostrar: - el número observado en el fichero de datos - el número esperado si fuera cierta la hipótesis de independencia entre filas y columnas
Mujer 79
% de ESTADO SALUD
Recuento % de ESTADO SALUD % de SEXO % del total
18,4%
9
16
25
36,0%
64,0%
100,0%
2,4%
3,6%
3,1%
1,1%
2,0%
3,1%
3
2
5
60,0%
40,0%
100,0%
,8%
,5%
,6%
,4%
,2%
,6%
377
439
816
46,2%
53,8%
100,0%
100,0%
100,0%
100,0%
46,2%
53,8%
100,0%
SPSS: GRÁFICOS DE BARRAS
SPSS: GRÁFICOS DE BARRAS GRAFICOS
300
BARRAS 200
Agrupadas Apiladas
100
Recuento
SEXO Hombre 0
Mujer Molt bona
Regular Bona
Molt dolenta Dolenta
ESTADO SALUD
Editando el gr áfico podemos manipularlo y cambiar el estilo, ya que por defecto se representan las frecuencias y son más ilustrativos los porcentajes
SPSS: GRÁFICOS DE BARRAS
SPSS: PRUEBA DE INDEPENDENCIA χ2
La relación entre 2 variables categóricas se representa gráficamente en barras simples o barras agrupadas o apiladas
100 90 80 70 60 50
ESTADO SALUD
40
Molt dolenta
30
Dolenta
20
Regular Bona
10 0
Molt bona Mujer
Hombre
4
SPSS: PRUEBA DE INDEPENDENCIA χ2 Tabla de contingencia ESTADO SALUD * SEXO
Pruebas de chi-cuadrado
SEXO ESTADO Molt bona Recuento SALUD Frecuencia esperada Bona
Recuento Frecuencia esperada
Regular
Total
Total 142
65,6
76,4
142,0
236
258
494
265,8
494,0
50
100
150
69,3
80,7
150,0
9
16
25
11,6
13,4
25,0
3
2
5
Frecuencia esperada
2,3
2,7
5,0
Recuento
377
439
816
377,0
439,0
816,0
Recuento
Recuento Frecuencia esperada
Molt dolenta
Mujer 63
228,2
Frecuencia esperada Dolenta
Hombre 79
Recuento
Frecuencia esperada
Valor
Sig. asintótic a (bilateral)
gl a
Chi-cuadrado de Pearson
16,997
4
,002
Razón de verosimilitud
17,249
4
,002
Asociación lineal por lineal
11,915
1
,001
N de casos válidos
816
a. 2 casillas (20,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 2,31.
p = 0.002 α nivel significación 0.05 p ≤ α ⇒ Rechazo H0 “Estado salud depende sexo, es mayor el % de mujeres que declara mala salud”
5