PRUEBAS PARAMETRICAS Y PRUEBAS NO PARAMETRICAS .
[email protected]
JUAN JOSÉ HERNÁNDEZ OCAÑA .
PRUEBAS PARAMETRICAS Los métodos paramétricos se basan en el muestreo de una población con parámetros específicos , como la media poblacional, la desviación estándar o la proporción p . Además deben de reunir ciertos requisitos como lo es, que los datos muestrales provengan de una población que se distribuya normalmente. Las pruebas paramétricas se emplean con datos en una escala ordinal, de intervalo o de razón .
Ventajas del empleo de pruebas no paramétricas
1.- Los métodos no paramétricos se aplican a una gran variedad de situaciones, ya que no se requiere que cumplan ciertas condiciones como lo es el de la distribución normal de los datos como es el caso de los métodos paramétricos 2.- Se aplican principalmente cuando empleamos datos nominales , como es el caso en muchas de las respuestas que se emplean en las encuestas y en muchas pruebas de psicología y pedagogía 3- Sus cálculos son más sencillos y nos permiten una interpretación mas fácil de entender y aplicar, aunque la potencia de las pruebas es menor a las pruebas paramétricas
PRUEBAS NO PARAMETRICAS
Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una escala de intervalo o de razón.
En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de medias, desviación estándar y varianzas
Se parte de los supuestos de que los datos se distribuyen normalmente y que las varianzas son iguales
Los métodos no paramétricos se pueden usar con datos nominales
No se emplean los parámetros de la población como estadísticos de prueba
El método se puede usar con datos de intervalo o de razón cuando no cabe supuesto alguno sobre la distribución de probabilidad de la población
Desventajas de las pruebas no paramétricas Son menos confiables que las pruebas paramétricas Por los general los métodos no paramétricos no consideran las magnitudes de las diferencias entre los datos, sino solamente el signo de las diferencias de las mismas
PRUEBA DE SIGNOS DE WILCOXON ES LA ALTERNATIVA NO PARAMÉTRICA DE LA PRUEBA DE MUESTRAS PARAMETRICAS DE DATOS APAREADOS
Prueba de rangos con signo de Wilcoxon
UTILIDAD Es útil para probar la aseveración de que una muestra proviene de una población con una mediana específica. Se emplea para grupos correlacionados ( datos apareados) y cuyos datos no siguen una distribución normal Esta prueba toma en cuenta la magnitud como la dirección de los puntajes de diferencia Puede emplearse en lugar de la prueba t para grupos dependientes cuando no se tiene certeza de la distribución de la muestra y no se tiene datos sobre la población
Prueba de signos de Wilcoxon
Es una prueba no parámetrica que utiliza rangos ordenados de datos muestrales consistentes en datos apareados. Se usa para probar las diferencias en las distribuciones poblacionales y se basa en los siguientes supuestos. Los datos consisten en datos apareados que se seleccionan aleatoriamente La podemos emplear para evaluar si dos grupos dependientes tienen distribuciones similares La distribución de las diferencias tiene una distribución que es aproximadamente simétrica Los datos dentro de cada pareja deben ser por lo menos de mediciones ordinales Para calcular Tobt hay que ordenar por rangos de puntaje de diferencia
Métodos por rangos Los datos se ordenan de acuerdo a un criterio, por ejemplo del más pequeño al más grande, o del mayor a menor, etc. ◦ El rango es el número que se asigna a un elemento muestral individual de acuerdo con su orden en la lista ordenada Se descartan todas las diferencias iguales a cero y se ordenan y etiquetan las diferencias absolutas restantes, desde la mínima hasta la máxima.
Cuando las diferencias son iguales se les asigna la clasificación media a sus posiciones ordenadas en el conjunto combinado de datos La idea básica que está detrás de la prueba del signo es el análisis de las frecuencias de los signos positivos y negativos para determinar si son significativamente diferentes
Emplearemos el estadístico de prueba con base en el número de veces que ocurre el signo menos frecuente.
Procedimiento 1.- Para cada par de datos, calcule la diferencia d, restando el segundo valor del primero, pero conserve los signos 2.- Descarte cualquier valor igual a cero.
3.- Ordene de menor a mayor en términos de valor absoluto 4.- Cuando las diferencias tengan el mismo valor numérico, asigne la media de los rangos Calcule la suma de los valores absolutos de rangos positivos y de los negativos
Prueba de signos Wilcoxon
Criterios T= se elige a la más pequeña de las siguientes sumas: La suma de los valores absolutos de los rangos negativos de las diferencias d La suma de los rangos positivos de las diferencias d Si el tamaño de la muestra es menor a 30 , entones empleamos estadístico T y se compara con T critico de tablas. Si el valor de TOBT es menor o igual a TCRI rechazamos Ho La suma de los rangos debe ser igual a
CRITERIO Si
el valor de TOBT es menor o igual a TCRI rechazamos Ho
rechazo Ho sí
t obt ≤
t critico
𝑍=
𝑅𝑚𝑒𝑛𝑜𝑟 −µ σ
𝑛(𝑛 + 1) 𝑢= 4
σ=
𝑛(𝑛 + 1)(2𝑛 + 1) 24
Prueba de signos de Wilcoxon
◦ La Ho sería: Las dos muestras provienen de poblaciones con la misma distribución ◦ ESO SIGINFICA QUE NO EXISTE DIFERENCIA ENTRE LA DISTRIBUCIÓN DE LOS DATOS DE LAS DOS POBLACIONES
◦ La hipótesis alternativa sería: Las dos muestras provienen de poblaciones con distribuciones diferentes
Ejercicio
Las mediciones de la capacidad mental de niños pequeños se hacen dándoles cubos y pidiéndoles que construyan una torre tan alta como sea posible. Un investigador está interesado en comprobar sí ambientes de aprendizaje modifican el desarrollo mental de los niños. Para ello realiza un experimento de construcción con cubos y mide la capacidad mental de los niños. Después les proporciona ambientes favorables al aprendizaje y repite el experimento tres meses después con los mismos niños para verificar si existen cambios. Los datos muestran los tiempos en segundos de la construcción de determinados modelos Utilice un nivel de significancia de 0.05 y pruebe la aseveración de que no hay diferencias entre los tiempos de la primera y la segunda prueba.
Niño
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
2ra prueba
30
19
19
23
29
78
42
20
12
39
14
81
17
31
52
1da prueba
30
6
14
8
14
42
14
22
17
8
11
30
14
17
15
Diferencia 0 s
13
5
15
15
36
28
-2
-5
31
3
51
3
14
37
Rangos de diferencias
6
4.5 8.5
Rangos con signos
6
4.5
8.5
8.5
8.5
12
12
10
1
10 1
4.5
4.5
Suma de signos positivos 99.5 Suma de signos negativos 5.5
11
2.5 14 2.5
7
13
11
2.5
7
13
14 2.5
EJERCICIO
Un investigador quiere determinar si la dificultad del material que han de aprender afecta el nivel de ansiedad de los estudiantes universitarios. A cada uno de los miembros de un muestra aleatoria de 12 alumnos se les asigna ciertas tareas de aprendizaje que se clasifican como tareas fáciles y difíciles. Antes de que los estudiantes inicien cada tarea, se les presenta algunos ejemplos de las diferentes tareas como muestra del material que van a aprender. A continuación, se mide el nivel de ansiedad que mostraron los alumnos, mediante un cuestionario. De esta manera, se mide el nivel de ansiedad antes de cada aprendizaje. Cuál es la conclusión utilizando la prueba de signo de WilcOXON y una alfa de 0.05
estudiante
1
2
3
4
5
6
7
8
9
10
11
12
Tarea Difícil
48
33
46
42
40
27
31
42
38
34
38
44
Tarea fácil
40
27
34
28
30
24
33
39
31
39
29
34
Diferencia
8
6
12
14
10
3
-2
3
7
-5
9
10
Rango de la diferencia
7
5
11
12
9.5
2.5
1
2.5
6
4
8
9.5
Tobt es la suma de los valores absolutos de rango negativos que es 5 El valor de T critico es de 14 ( considerando n = 12) Por lo que rechazamos Ho y concluimos que los materiales influyen en la ansiedad de los estudiantes
Una de las principales compañías petroleras realizan un experimento para averiguar sí una película filmada puede promover actitudes más favorables hacia las grandes empresas . Doce individuos participan en un diseño de medidas replicadas. En la condición antes, cada sujeto llena un cuestionario para evaluar su actitud actual hacia las grandes compañías petroleras. En la condición después el mismo sujeto mira la película y después contesta el cuestionario. Las calificaciones altas mostradas en la tabla muestran actitudes más favorables. Considera que la muestra no se distribuye normalmente Con un alfa de 0,05 que podemos concluir: ◦ Ho La presentación de la película no incide en fomentar una actitud más favorable hacia las compañías petroleras ◦ Ha La presentación de la película influye de manera favorable ( mas que ) en la actitud hacia las compañías petroleras
Antes
43
48
25
24
15
18
35
28
41
28
34
12
después 45
60
22
33
6
22
41
21
55
33
44
23
diferenc 2 ia
12
-3
9
-9
4
6
-7
14
5
10
11
11
2
7.5
7.5
3
5
6
12
4
9
10
rango
1
Suma de negativos= 15.5 Lo consideramos como T obt
Suma de positivos= 62.5
Para una alfa de 0.05 de una cola el valor de T critico es de 11 Como 15.5 17 no Rechazo Ho Las películas promueven una actitud más favorable hacía las compañías petroleras
PRUEBA DE U MANN WHITNEY O WILCOXON PARA GRUPOS INDEPENDIENTES
ESTA PRUEBA SE EMPLEA EN COMBINACIÓN CON EL DISEÑO DE GRUPOS INDEPENDIENTES, CON DATOS QUE TIENEN POR LO MENOS UNA ESCALA ORDINAL ESTA PRUEBA PUEDE SUSTITUIR A LA PRUEBA T STUDENT CUANDO ÉSTA NO CUMPLE CON LA SUPOSICIÓN DE NORMALIDAD DE SU POBLACIÓN. LA HIPÓTESIS NULA Y ALTERNATIVA SE ENUNCIAN SIN MENCIONAR LOS PARÁMETROS DE LA POBLACIÓN
PRUEBA DE U MANN WHITNEY O WILCONOX PARA GRUPOS INDEPENDIENTES
YA QUE SE REQUIERE ORDENAR LOS DATOS POR RANGOS PARA CALCULAR U ESTA PRUEBA REQUIERE QUE LOS DATOS ESTÉN POR LO MENOS EN UNA ESCALA ORDINAL. TAMBIÉN PUEDE EMPLEARSE EN LUGAR DE LA PRUEBA T CUANDO LOS DATOS NO SE ENCUENTRAN EN UNA ESCALA DE RAZÓN O INTERVALO.
BÁSICAMENTE COMPARA LA DIFERENCIA ENTRE LAS MEDIANAS DE DOS GRUPOS
MANN- WHITNEY El ordenamiento de rangos es de menor a mayor y no se consideran valores absolutos como en la prueba de signos En este caso se combinan los dos grupos Se ordenan los rangos y se asigna a cada uno un puntaje de rango usando como 1 al puntaje más bajo En este caso si s e toma en cuenta el signo para dar el orden jerárquico en el rango Sume los Rangos del grupo 1 y Sume los rangos del grupo 2
Resuelva las ecuaciones y asigne el valor de Uobt al valor del grupo en el que se obtenga el valor más bajo Obtenga U crit y compare Si Uobt ≤ U crit Rechazo Ho ( si es menor o igual ) Si U´obt ≥ U´ crit Rechazo Ho ( Sí es mayor o igual)
Prueba z y rangos
Si una de las muestras o las dos exceden el tamaño de 10 puede emplearse la aproximación a la distribución normal empleando el estadístico Z. La prueba es de dos colas, puesto que un valor grande de z indicaría que los rangos más altos se encuentran desproporcionalmente en la primera muestra
𝑍=
𝑅 −0.5 (𝑈) σ
Factor de corrección para muestras pequeñas
Criterio para z
Rechazo Ho si
ZOBT ≥ ZCRITICO
Ejercicio Una psicóloga del desarrollo, tiene la sospecha de que el hecho de consumir una dieta rica en proteínas a una edad mejora el desarrollo intelectual. Para probarlo, se realiza un experimento en el cual 17 niños son elegidos aleatoriamente entre los niños que tienen un año de edad. Al grupo control se le alimenta durante 3 años con una dieta usual, pobre en proteínas, mientras que el grupo experimental ingiere una dieta rica en proteínas en ese mismo período. Al final del experimento cada uno de los niños es sometido a una prueba de CI. De acuerdo a los datos que se presentan en la tabla siguiente y considerando que no se sabe sí los datos se distribuyen normalmente y sí emplea un alfa de 0.05 , cuales serían sus conclusiones?
GRUPO 1 EJERCICO control
GRUPO 2 experimental
RANGO 1 1
102
8
113
11
118
15
130
16
135
17
140
12
120
14
125
7
111
13
122
5
108
10
117
4
107
9
115
3
105
6
110
2
104
Rango 2
Puntaje
102
104
105
107
108
110
111
113
115
Rango
1
2
3
4
5
6
7
8
9
Puntaje
117
118
120
122
125
130
135
140
Rango
10
11
12
13
14
15
16
17
N1 = 9
N2= 8
R1= 53
R1= 100
U= 64
U= 8
Z = -2. 69
Busco U critico en tablas con n1= y n2 = 8 y un alfa de 0.05 y obtengo un valor de , por lo que rechazo Ho En el caso de Z critico su valor es
ejercicio está interesada en averiguar si existe alguna diferencia Una psicóloga en la habilidad espacial entre las persona zurdas y las diestras. Para averiguarlo toma una muestra de 10 zurdos y 10 diestros, entre los estudiantes de esta universidad y los somete a una prueba para medir su habilidad espacial. Tome nota que uno de los sujetos de la muestra no se presentó para la prueba. No se sabe si los datos se distribuyen normalmente y no se tienen datos poblacionales al respecto. Si considera un alfa de 0.05 de dos colas cuál es sus conclusión
Zurdos
87
94
56
74
98
83
92
84
76
diestros
47
68
92
73
71
82
55
61
75
85
Zurdos
87 15
94 18
56 3
74 8
98 19
83 12
92 16.5
84 13
76 10
diestros
47 1
68 5
92 16.5
73 7
71 6
82 11
55 2
61 4
75 9
Zurdos
114.5
Diestros
75.5
85 14
Tarea
Un ornitólogo sospecha que las inyecciones de la hormona FSH incrementa la habilidad de canto de los pájaros machos. Para poner a prueba su hipótesis selecciona 20 pájaros y los dividen en dos grupos de 10 cada uno. Sin embargo dos aves del segundo grupo no pudieron ser evaluadas. Al primer grupo se les administra la hormona y al segundo grupo solo una solución salina como control. Después de ello se hace un registro de resultados donde resultados mayores indican mayor cantidad de cantos . Empleando una alfa de 0.05 y considerando que los datos no se distribuyen normalmente ◦ Cual son sus hipótesis nula y alternativa? ◦ Cuáles son su conclusiones?
Solución salina
17
31
14
12
29
23
7
19
FSH
10
29
37
41
16
45
34
57
Solución salina
17 7
31 13
14 5
12 4
29 11.5
23 9
7 2
19 8
FSH
10 3
29 11.5
37 15
41 16
16 6
45 17
34 14
57 18
SOLUCION SALINA
70.5
FSH
100.5
28
28 10
3
3 1
Hipnosis
ordinario
20
42
21
35
33
30
40
53
24
57
43
26
48
37
31
30
22
51
44
62
30
59
• Un consejero universitario cree que la hipnosis es más eficaz para reducir que el tratamiento habitual que se aplica a los estudiantes que muestran un alto nivel de ansiedad frente a los exámenes. Para probar su sospecha, divide en dos grupos a 22 estudiantes que muestran altos niveles de ansiedad. Uno de los grupos recibe el tratamiento a base de hipnosis y el otro recibe el tratamiento ordinario. Una vez concluidos los tratamientos, los estudiantes son sometidos a pruebas sobre ansiedad. Considerando un alfa de 0.05, resuelva: – A) considere que los datos se distribuyen normalmente – B)Considere que los datos no se distribuyen normalmente – Cuáles son sus conclusiones en ambos casos?
Hipnosis
ordinario
20
(1)
42 (14)
21
(2)
35 (11)
33 (10)
30 (7)
40 (13)
53 (19)
24 (4)
57 (20)
43 (15)
26 (5)
48 (17)
37 (12)
31 (9)
30 (7)
22 (3)
51 (18)
44 (16)
62 (22)
30 (7)
59 (21)
R1 = 97 R2= 156
Prueba de KRUSKAL WALLIS Esta prueba se utiliza para probar la hipótesis nula de que tres o más muestras de grupos independientes provienen de poblaciones idénticas. ◦ Es una prueba no parámetrica que utiliza rangos de muestras independientes de tres o más poblaciones
Esta prueba tiene una distribución que pude aproximarse por la distribución ji cuadrada siempre y cuando tenga al menos cinco observaciones en cada grupo. ◦ La prueba es de cola derecha ◦ El estadístico de prueba H es básicamente una medida de la varianza de las suma de los rangos Ri ,R2… Rk. Por ello si los rangos se distribuyen de manera equitativa entre los grupos muestrales, entonces H debe ser un número relativamente pequeño
KRUSKALS
PRUEBA DE KRUSKAL WALLIS Esta prueba se emplea como sustituta del análisis de varianza ya que no supone ni la normalidad de la población ni la homogeneidad de la varianza como la ANOVA No hace predicción alguna sobre las medias de la población, sólo afirma que cuando menos una de las distribuciones poblaciones es diferente de algunas de las otras distribuciones poblacionales Por lo que la hipótesis nula afirma que las muestras son aleatorias, extraídas de las mismas o idénticas distribuciones poblaciones
Condiciones Esta prueba utiliza rango muestrales de tres o más poblaciones independientes
Cada muestra tiene al menos cinco observaciones
El estadístico de la prueba H es una mediad de la varianza de las sumas de los rangos R1, R2, R3…Rn Si los rangos se distribuyen de una manera equitativa entre los grupos muestrales, entonces H debe ser un número relativamente pequeño por lo que no se rechazará la hipótesis nula
PRUEBA DE KRUSKAL WALLIS Esta prueba es de cola derecha y la regla de decisión es
Si
Hobt ≥ H cri
rechazamos Ho
Se emplea tabla de CHI cuadrada con gl= k – 1
Una empresa está realizando una investigación sobre diferentes métodos de capacitación para el área gerencial. El experimento implica tres condiciones. En la condición 1 los sujetos reciben capacitación en dos estilos gerenciales. En la condición 2, los individuos no reciben capacitación adicional, sÍ no ,solo son asignados al trabajo de acuerdo a su propio estilo gerencial. La condición 3 es de control y en ella los sujetos no reciben capacitación alguna . Después de que se han desempeñado en su trabajo durante 6 meses se hace una evaluación y se califica su desempeño. Mientras más alta sea la calificación, mejor será el rendimiento. Si considera un alfa de 0.05 y sabemos que los datos no se distribuyen normalmente , cuáles son sus conclusiones?
EJERCICIO Condición 1
Condición 2
cal
rango
cal
Rango
65 84 87 53 70 85 56 63
8 16 19.5 2 9 17 4 7
90 83 76 87 92 86 93
21 15 12 19.5 22 18 23
Condición 3 Cal
rango
55 82 71 60 52 81 73 57
3 14 10 6 1 13 11 5
EJERCICIO
Un investigador sospecha que los individuos de diferentes profesiones varía en su grado de ser hipnotizados. Para el experimento son elegidos al azar 6 abogados, 6 médicos y 6 bailarines. A cada uno se les practica un examen de susceptibilidad hipnótica . Mientras más alta sea la calificación mayor será la susceptibilidad a ser hipnotizados. Suponga que los datos violan los supuestos necesarios para el uso de la prueba F pero al menos están en una escala ordinal. Si emplea un alfa de 0.05 . Cuáles serían sus conclusiones?
Abogados
26 17
27
32
20
25
Médicos
14 19
28
22
25
15
Bailarines
30 21
35
29
37
34
La manufacturera Gómez recluta y contrata empleados para su equipo gerencial en tres universidades . En los últimos días, su departamento de personal ha estado reuniendo y revisando las calificaciones anuales de desempeño para determinar si hay diferencias en la eficiencia entre los gerentes contratados de esas escuelas. En la tabla se resumen los resultados , la calificación de cada gerente está expresada en una escala de 0 a 100. Con un alfa de 0.05 se desea saber si las tres poblaciones son idénticas en cuanto a las evaluaciones de desempeño
Escuela 1
Escuela 2
Escuela 3
25
60
50
70
20
70
60
30
60
85
15
80
95
40
90
90
35
70
80
75
ANEXO
Métodos basados en rangos
Estamos ante un método que emplea una escala ordinal, esto es, lo datos se ordenan de acuerdo a los siguientes criterios ◦ Del más pequeño a más grande ó de mejor a peor ◦ Un rango es un número que se asigna a un elemento muestral individual de acuerdo con su orden en la lista ordenada
Cálculos de Rangos 3
5
5
10
12
1
2
3
4
5
3
5
5
10
12
1
2.5
2.5
4
5
11
12
12
14
15
16
17
17
17
19
20
1
2
3
4
5
6
7
8
9
10
11
11
12
12
14
15
16
17
17
17
19
20
1
2.5
2.5
4
5
6
8
8
8
10
11