PRUEBAS PARAMETRICAS Y PRUEBAS NO PARAMETRICAS

PRUEBAS PARAMETRICAS Y PRUEBAS NO PARAMETRICAS . [email protected] JUAN JOSÉ HERNÁNDEZ OCAÑA . PRUEBAS PARAMETRICAS Los métodos paramétricos se

20 downloads 385 Views 1MB Size

Recommend Stories


ESTIMACIONES PARAMETRICAS Y NO PARAMETRICAS DE LA DISTRIBUCION DEL INGRESO DE LOS OCUPADOS DEL GRAN BUENOS AIRES,
ESTIMACIONES PARAMETRICAS Y NO PARAMETRICAS DE LA DISTRIBUCION DEL INGRESO DE LOS OCUPADOS DEL GRAN BUENOS AIRES, 1992-1997 Patricia Botargues1 y Die

11. PRUEBAS NO PARAMÉTRICAS
11. PRUEBAS NO PARAMÉTRICAS Edgar Acuña http://math.uprm/edu/~edgar UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ PRUEBAS NO PARAMÉT

AJUSTES AUTOMATICOS Y REFORMAS PARAMETRICAS EN LOS SISTEMAS DE REPARTO
Ajustes automáticos y Reformas Parametricas en los Sistemas de Reparto un Modelo aplicable a Regimenes de Prestaciones revalorizables de acuerdo con l

Story Transcript

PRUEBAS PARAMETRICAS Y PRUEBAS NO PARAMETRICAS .

[email protected]

JUAN JOSÉ HERNÁNDEZ OCAÑA .

PRUEBAS PARAMETRICAS Los métodos paramétricos se basan en el muestreo de una población con parámetros específicos , como la media poblacional, la desviación estándar o la proporción p . Además deben de reunir ciertos requisitos como lo es, que los datos muestrales provengan de una población que se distribuya normalmente. Las pruebas paramétricas se emplean con datos en una escala ordinal, de intervalo o de razón .

Ventajas del empleo de pruebas no paramétricas

1.- Los métodos no paramétricos se aplican a una gran variedad de situaciones, ya que no se requiere que cumplan ciertas condiciones como lo es el de la distribución normal de los datos como es el caso de los métodos paramétricos 2.- Se aplican principalmente cuando empleamos datos nominales , como es el caso en muchas de las respuestas que se emplean en las encuestas y en muchas pruebas de psicología y pedagogía 3- Sus cálculos son más sencillos y nos permiten una interpretación mas fácil de entender y aplicar, aunque la potencia de las pruebas es menor a las pruebas paramétricas

PRUEBAS NO PARAMETRICAS

Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una escala de intervalo o de razón.

En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de medias, desviación estándar y varianzas

Se parte de los supuestos de que los datos se distribuyen normalmente y que las varianzas son iguales

Los métodos no paramétricos se pueden usar con datos nominales

No se emplean los parámetros de la población como estadísticos de prueba

El método se puede usar con datos de intervalo o de razón cuando no cabe supuesto alguno sobre la distribución de probabilidad de la población

Desventajas de las pruebas no paramétricas Son menos confiables que las pruebas paramétricas Por los general los métodos no paramétricos no consideran las magnitudes de las diferencias entre los datos, sino solamente el signo de las diferencias de las mismas

PRUEBA DE SIGNOS DE WILCOXON ES LA ALTERNATIVA NO PARAMÉTRICA DE LA PRUEBA DE MUESTRAS PARAMETRICAS DE DATOS APAREADOS

Prueba de rangos con signo de Wilcoxon 

UTILIDAD Es útil para probar la aseveración de que una muestra proviene de una población con una mediana específica.  Se emplea para grupos correlacionados ( datos apareados) y cuyos datos no siguen una distribución normal  Esta prueba toma en cuenta la magnitud como la dirección de los puntajes de diferencia  Puede emplearse en lugar de la prueba t para grupos dependientes cuando no se tiene certeza de la distribución de la muestra y no se tiene datos sobre la población 

Prueba de signos de Wilcoxon



Es una prueba no parámetrica que utiliza rangos ordenados de datos muestrales consistentes en datos apareados. Se usa para probar las diferencias en las distribuciones poblacionales y se basa en los siguientes supuestos.  Los datos consisten en datos apareados que se seleccionan aleatoriamente  La podemos emplear para evaluar si dos grupos dependientes tienen distribuciones similares  La distribución de las diferencias tiene una distribución que es aproximadamente simétrica  Los datos dentro de cada pareja deben ser por lo menos de mediciones ordinales  Para calcular Tobt hay que ordenar por rangos de puntaje de diferencia

Métodos por rangos Los datos se ordenan de acuerdo a un criterio, por ejemplo del más pequeño al más grande, o del mayor a menor, etc. ◦ El rango es el número que se asigna a un elemento muestral individual de acuerdo con su orden en la lista ordenada Se descartan todas las diferencias iguales a cero y se ordenan y etiquetan las diferencias absolutas restantes, desde la mínima hasta la máxima.

Cuando las diferencias son iguales se les asigna la clasificación media a sus posiciones ordenadas en el conjunto combinado de datos La idea básica que está detrás de la prueba del signo es el análisis de las frecuencias de los signos positivos y negativos para determinar si son significativamente diferentes

Emplearemos el estadístico de prueba con base en el número de veces que ocurre el signo menos frecuente.

Procedimiento 1.- Para cada par de datos, calcule la diferencia d, restando el segundo valor del primero, pero conserve los signos 2.- Descarte cualquier valor igual a cero.

3.- Ordene de menor a mayor en términos de valor absoluto 4.- Cuando las diferencias tengan el mismo valor numérico, asigne la media de los rangos Calcule la suma de los valores absolutos de rangos positivos y de los negativos

Prueba de signos Wilcoxon



Criterios  T= se elige a la más pequeña de las siguientes sumas:  La suma de los valores absolutos de los rangos negativos de las diferencias d  La suma de los rangos positivos de las diferencias d  Si el tamaño de la muestra es menor a 30 , entones empleamos estadístico T y se compara con T critico de tablas.  Si el valor de TOBT es menor o igual a TCRI rechazamos Ho  La suma de los rangos debe ser igual a

CRITERIO  Si

el valor de TOBT es menor o igual a TCRI rechazamos Ho

rechazo Ho sí

t obt ≤

t critico



𝑍=

𝑅𝑚𝑒𝑛𝑜𝑟 −µ σ

𝑛(𝑛 + 1) 𝑢= 4

σ=

𝑛(𝑛 + 1)(2𝑛 + 1) 24

Prueba de signos de Wilcoxon

◦ La Ho sería: Las dos muestras provienen de poblaciones con la misma distribución ◦ ESO SIGINFICA QUE NO EXISTE DIFERENCIA ENTRE LA DISTRIBUCIÓN DE LOS DATOS DE LAS DOS POBLACIONES

◦ La hipótesis alternativa sería: Las dos muestras provienen de poblaciones con distribuciones diferentes

Ejercicio



Las mediciones de la capacidad mental de niños pequeños se hacen dándoles cubos y pidiéndoles que construyan una torre tan alta como sea posible. Un investigador está interesado en comprobar sí ambientes de aprendizaje modifican el desarrollo mental de los niños. Para ello realiza un experimento de construcción con cubos y mide la capacidad mental de los niños. Después les proporciona ambientes favorables al aprendizaje y repite el experimento tres meses después con los mismos niños para verificar si existen cambios. Los datos muestran los tiempos en segundos de la construcción de determinados modelos  Utilice un nivel de significancia de 0.05 y pruebe la aseveración de que no hay diferencias entre los tiempos de la primera y la segunda prueba.

Niño

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

2ra prueba

30

19

19

23

29

78

42

20

12

39

14

81

17

31

52

1da prueba

30

6

14

8

14

42

14

22

17

8

11

30

14

17

15

Diferencia 0 s

13

5

15

15

36

28

-2

-5

31

3

51

3

14

37

Rangos de diferencias

6

4.5 8.5

Rangos con signos

6

4.5

8.5

8.5

8.5

12

12

10

1

10 1

4.5

4.5

Suma de signos positivos 99.5 Suma de signos negativos 5.5

11

2.5 14 2.5

7

13

11

2.5

7

13

14 2.5

EJERCICIO

Un investigador quiere determinar si la dificultad del material que han de aprender afecta el nivel de ansiedad de los estudiantes universitarios. A cada uno de los miembros de un muestra aleatoria de 12 alumnos se les asigna ciertas tareas de aprendizaje que se clasifican como tareas fáciles y difíciles. Antes de que los estudiantes inicien cada tarea, se les presenta algunos ejemplos de las diferentes tareas como muestra del material que van a aprender. A continuación, se mide el nivel de ansiedad que mostraron los alumnos, mediante un cuestionario. De esta manera, se mide el nivel de ansiedad antes de cada aprendizaje. Cuál es la conclusión utilizando la prueba de signo de WilcOXON y una alfa de 0.05

estudiante

1

2

3

4

5

6

7

8

9

10

11

12

Tarea Difícil

48

33

46

42

40

27

31

42

38

34

38

44

Tarea fácil

40

27

34

28

30

24

33

39

31

39

29

34

Diferencia

8

6

12

14

10

3

-2

3

7

-5

9

10

Rango de la diferencia

7

5

11

12

9.5

2.5

1

2.5

6

4

8

9.5

Tobt es la suma de los valores absolutos de rango negativos que es 5 El valor de T critico es de 14 ( considerando n = 12) Por lo que rechazamos Ho y concluimos que los materiales influyen en la ansiedad de los estudiantes

Una de las principales compañías petroleras realizan un experimento para averiguar sí una película filmada puede promover actitudes más favorables hacia las grandes empresas . Doce individuos participan en un diseño de medidas replicadas. En la condición antes, cada sujeto llena un cuestionario para evaluar su actitud actual hacia las grandes compañías petroleras. En la condición después el mismo sujeto mira la película y después contesta el cuestionario. Las calificaciones altas mostradas en la tabla muestran actitudes más favorables. Considera que la muestra no se distribuye normalmente Con un alfa de 0,05 que podemos concluir: ◦ Ho La presentación de la película no incide en fomentar una actitud más favorable hacia las compañías petroleras ◦ Ha La presentación de la película influye de manera favorable ( mas que ) en la actitud hacia las compañías petroleras

Antes

43

48

25

24

15

18

35

28

41

28

34

12

después 45

60

22

33

6

22

41

21

55

33

44

23

diferenc 2 ia

12

-3

9

-9

4

6

-7

14

5

10

11

11

2

7.5

7.5

3

5

6

12

4

9

10

rango

1

Suma de negativos= 15.5 Lo consideramos como T obt

Suma de positivos= 62.5

Para una alfa de 0.05 de una cola el valor de T critico es de 11 Como 15.5 17 no Rechazo Ho Las películas promueven una actitud más favorable hacía las compañías petroleras

PRUEBA DE U MANN WHITNEY O WILCOXON PARA GRUPOS INDEPENDIENTES

ESTA PRUEBA SE EMPLEA EN COMBINACIÓN CON EL DISEÑO DE GRUPOS INDEPENDIENTES, CON DATOS QUE TIENEN POR LO MENOS UNA ESCALA ORDINAL ESTA PRUEBA PUEDE SUSTITUIR A LA PRUEBA T STUDENT CUANDO ÉSTA NO CUMPLE CON LA SUPOSICIÓN DE NORMALIDAD DE SU POBLACIÓN. LA HIPÓTESIS NULA Y ALTERNATIVA SE ENUNCIAN SIN MENCIONAR LOS PARÁMETROS DE LA POBLACIÓN

PRUEBA DE U MANN WHITNEY O WILCONOX PARA GRUPOS INDEPENDIENTES

YA QUE SE REQUIERE ORDENAR LOS DATOS POR RANGOS PARA CALCULAR U ESTA PRUEBA REQUIERE QUE LOS DATOS ESTÉN POR LO MENOS EN UNA ESCALA ORDINAL. TAMBIÉN PUEDE EMPLEARSE EN LUGAR DE LA PRUEBA T CUANDO LOS DATOS NO SE ENCUENTRAN EN UNA ESCALA DE RAZÓN O INTERVALO.

BÁSICAMENTE COMPARA LA DIFERENCIA ENTRE LAS MEDIANAS DE DOS GRUPOS

MANN- WHITNEY El ordenamiento de rangos es de menor a mayor y no se consideran valores absolutos como en la prueba de signos En este caso se combinan los dos grupos Se ordenan los rangos y se asigna a cada uno un puntaje de rango usando como 1 al puntaje más bajo En este caso si s e toma en cuenta el signo para dar el orden jerárquico en el rango Sume los Rangos del grupo 1 y Sume los rangos del grupo 2

Resuelva las ecuaciones y asigne el valor de Uobt al valor del grupo en el que se obtenga el valor más bajo Obtenga U crit y compare Si Uobt ≤ U crit Rechazo Ho ( si es menor o igual ) Si U´obt ≥ U´ crit Rechazo Ho ( Sí es mayor o igual)

Prueba z y rangos 

Si una de las muestras o las dos exceden el tamaño de 10 puede emplearse la aproximación a la distribución normal empleando el estadístico Z. La prueba es de dos colas, puesto que un valor grande de z indicaría que los rangos más altos se encuentran desproporcionalmente en la primera muestra 

 

𝑍=

𝑅 −0.5 (𝑈) σ

Factor de corrección para muestras pequeñas

Criterio para z 



Rechazo Ho si

ZOBT ≥ ZCRITICO

Ejercicio Una psicóloga del desarrollo, tiene la sospecha de que el hecho de consumir una dieta rica en proteínas a una edad mejora el desarrollo intelectual. Para probarlo, se realiza un experimento en el cual 17 niños son elegidos aleatoriamente entre los niños que tienen un año de edad. Al grupo control se le alimenta durante 3 años con una dieta usual, pobre en proteínas, mientras que el grupo experimental ingiere una dieta rica en proteínas en ese mismo período. Al final del experimento cada uno de los niños es sometido a una prueba de CI. De acuerdo a los datos que se presentan en la tabla siguiente y considerando que no se sabe sí los datos se distribuyen normalmente y sí emplea un alfa de 0.05 , cuales serían sus conclusiones?

GRUPO 1 EJERCICO control

GRUPO 2 experimental

RANGO 1 1

102

8

113

11

118

15

130

16

135

17

140

12

120

14

125

7

111

13

122

5

108

10

117

4

107

9

115

3

105

6

110

2

104

Rango 2

Puntaje

102

104

105

107

108

110

111

113

115

Rango

1

2

3

4

5

6

7

8

9

Puntaje

117

118

120

122

125

130

135

140

Rango

10

11

12

13

14

15

16

17

N1 = 9

N2= 8

R1= 53

R1= 100

U= 64

U= 8

Z = -2. 69

Busco U critico en tablas con n1= y n2 = 8 y un alfa de 0.05 y obtengo un valor de , por lo que rechazo Ho En el caso de Z critico su valor es

ejercicio está interesada en averiguar si existe alguna diferencia Una psicóloga en la habilidad espacial entre las persona zurdas y las diestras. Para averiguarlo toma una muestra de 10 zurdos y 10 diestros, entre los estudiantes de esta universidad y los somete a una prueba para medir su habilidad espacial. Tome nota que uno de los sujetos de la muestra no se presentó para la prueba. No se sabe si los datos se distribuyen normalmente y no se tienen datos poblacionales al respecto. Si considera un alfa de 0.05 de dos colas cuál es sus conclusión

Zurdos

87

94

56

74

98

83

92

84

76

diestros

47

68

92

73

71

82

55

61

75

85

Zurdos

87 15

94 18

56 3

74 8

98 19

83 12

92 16.5

84 13

76 10

diestros

47 1

68 5

92 16.5

73 7

71 6

82 11

55 2

61 4

75 9

Zurdos

114.5

Diestros

75.5

85 14

Tarea

Un ornitólogo sospecha que las inyecciones de la hormona FSH incrementa la habilidad de canto de los pájaros machos. Para poner a prueba su hipótesis selecciona 20 pájaros y los dividen en dos grupos de 10 cada uno. Sin embargo dos aves del segundo grupo no pudieron ser evaluadas. Al primer grupo se les administra la hormona y al segundo grupo solo una solución salina como control. Después de ello se hace un registro de resultados donde resultados mayores indican mayor cantidad de cantos . Empleando una alfa de 0.05 y considerando que los datos no se distribuyen normalmente ◦ Cual son sus hipótesis nula y alternativa? ◦ Cuáles son su conclusiones?

Solución salina

17

31

14

12

29

23

7

19

FSH

10

29

37

41

16

45

34

57

Solución salina

17 7

31 13

14 5

12 4

29 11.5

23 9

7 2

19 8

FSH

10 3

29 11.5

37 15

41 16

16 6

45 17

34 14

57 18

SOLUCION SALINA

70.5

FSH

100.5

28

28 10

3

3 1

Hipnosis

ordinario

20

42

21

35

33

30

40

53

24

57

43

26

48

37

31

30

22

51

44

62

30

59

• Un consejero universitario cree que la hipnosis es más eficaz para reducir que el tratamiento habitual que se aplica a los estudiantes que muestran un alto nivel de ansiedad frente a los exámenes. Para probar su sospecha, divide en dos grupos a 22 estudiantes que muestran altos niveles de ansiedad. Uno de los grupos recibe el tratamiento a base de hipnosis y el otro recibe el tratamiento ordinario. Una vez concluidos los tratamientos, los estudiantes son sometidos a pruebas sobre ansiedad. Considerando un alfa de 0.05, resuelva: – A) considere que los datos se distribuyen normalmente – B)Considere que los datos no se distribuyen normalmente – Cuáles son sus conclusiones en ambos casos?

Hipnosis

ordinario

20

(1)

42 (14)

21

(2)

35 (11)

33 (10)

30 (7)

40 (13)

53 (19)

24 (4)

57 (20)

43 (15)

26 (5)

48 (17)

37 (12)

31 (9)

30 (7)

22 (3)

51 (18)

44 (16)

62 (22)

30 (7)

59 (21)

R1 = 97 R2= 156

Prueba de KRUSKAL WALLIS Esta prueba se utiliza para probar la hipótesis nula de que tres o más muestras de grupos independientes provienen de poblaciones idénticas. ◦ Es una prueba no parámetrica que utiliza rangos de muestras independientes de tres o más poblaciones

Esta prueba tiene una distribución que pude aproximarse por la distribución ji cuadrada siempre y cuando tenga al menos cinco observaciones en cada grupo. ◦ La prueba es de cola derecha ◦ El estadístico de prueba H es básicamente una medida de la varianza de las suma de los rangos Ri ,R2… Rk. Por ello si los rangos se distribuyen de manera equitativa entre los grupos muestrales, entonces H debe ser un número relativamente pequeño

KRUSKALS

PRUEBA DE KRUSKAL WALLIS Esta prueba se emplea como sustituta del análisis de varianza ya que no supone ni la normalidad de la población ni la homogeneidad de la varianza como la ANOVA No hace predicción alguna sobre las medias de la población, sólo afirma que cuando menos una de las distribuciones poblaciones es diferente de algunas de las otras distribuciones poblacionales Por lo que la hipótesis nula afirma que las muestras son aleatorias, extraídas de las mismas o idénticas distribuciones poblaciones

Condiciones Esta prueba utiliza rango muestrales de tres o más poblaciones independientes

Cada muestra tiene al menos cinco observaciones

El estadístico de la prueba H es una mediad de la varianza de las sumas de los rangos R1, R2, R3…Rn Si los rangos se distribuyen de una manera equitativa entre los grupos muestrales, entonces H debe ser un número relativamente pequeño por lo que no se rechazará la hipótesis nula

PRUEBA DE KRUSKAL WALLIS Esta prueba es de cola derecha y la regla de decisión es

Si

Hobt ≥ H cri

rechazamos Ho

Se emplea tabla de CHI cuadrada con gl= k – 1

Una empresa está realizando una investigación sobre diferentes métodos de capacitación para el área gerencial. El experimento implica tres condiciones. En la condición 1 los sujetos reciben capacitación en dos estilos gerenciales. En la condición 2, los individuos no reciben capacitación adicional, sÍ no ,solo son asignados al trabajo de acuerdo a su propio estilo gerencial. La condición 3 es de control y en ella los sujetos no reciben capacitación alguna . Después de que se han desempeñado en su trabajo durante 6 meses se hace una evaluación y se califica su desempeño. Mientras más alta sea la calificación, mejor será el rendimiento. Si considera un alfa de 0.05 y sabemos que los datos no se distribuyen normalmente , cuáles son sus conclusiones?

EJERCICIO Condición 1

Condición 2

cal

rango

cal

Rango

65 84 87 53 70 85 56 63

8 16 19.5 2 9 17 4 7

90 83 76 87 92 86 93

21 15 12 19.5 22 18 23

Condición 3 Cal

rango

55 82 71 60 52 81 73 57

3 14 10 6 1 13 11 5

EJERCICIO

Un investigador sospecha que los individuos de diferentes profesiones varía en su grado de ser hipnotizados. Para el experimento son elegidos al azar 6 abogados, 6 médicos y 6 bailarines. A cada uno se les practica un examen de susceptibilidad hipnótica . Mientras más alta sea la calificación mayor será la susceptibilidad a ser hipnotizados. Suponga que los datos violan los supuestos necesarios para el uso de la prueba F pero al menos están en una escala ordinal. Si emplea un alfa de 0.05 . Cuáles serían sus conclusiones?

Abogados

26 17

27

32

20

25

Médicos

14 19

28

22

25

15

Bailarines

30 21

35

29

37

34

La manufacturera Gómez recluta y contrata empleados para su equipo gerencial en tres universidades . En los últimos días, su departamento de personal ha estado reuniendo y revisando las calificaciones anuales de desempeño para determinar si hay diferencias en la eficiencia entre los gerentes contratados de esas escuelas. En la tabla se resumen los resultados , la calificación de cada gerente está expresada en una escala de 0 a 100. Con un alfa de 0.05 se desea saber si las tres poblaciones son idénticas en cuanto a las evaluaciones de desempeño

Escuela 1

Escuela 2

Escuela 3

25

60

50

70

20

70

60

30

60

85

15

80

95

40

90

90

35

70

80

75

ANEXO

Métodos basados en rangos

Estamos ante un método que emplea una escala ordinal, esto es, lo datos se ordenan de acuerdo a los siguientes criterios ◦ Del más pequeño a más grande ó de mejor a peor ◦ Un rango es un número que se asigna a un elemento muestral individual de acuerdo con su orden en la lista ordenada

Cálculos de Rangos 3

5

5

10

12

1

2

3

4

5

3

5

5

10

12

1

2.5

2.5

4

5

11

12

12

14

15

16

17

17

17

19

20

1

2

3

4

5

6

7

8

9

10

11

11

12

12

14

15

16

17

17

17

19

20

1

2.5

2.5

4

5

6

8

8

8

10

11

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.