LAS PRUEBAS PARAMÉTRICAS 1. Se conoce el modelo de distribución de la población objeto de estudio y se desconoce un número finito de parámetros de dicha distribución que hay que estimar con los datos de la muestra. 2. Requieren conocer la distribución de la muestra para poder realizar inferencias sobre la población. LAS PRUEBAS NO PARAMÉTRICAS 1. Son métodos de distribución libre. No requieren conocer la distribución de la muestra. 2. Se utilizan estadísticos cuya distribución se determina con independencia de cuál sea la distribución de la población. web: http://www.uv.es/friasnav/
1
LAS PRUEBAS NO PARAMÉTRICAS: ¿Para qué se utilizan? 1. Son una alternativa a las pruebas paramétricas cuando los datos no cumplen los requisitos de las pruebas paramétricas. 2. Permiten conocer cómo es la forma de la distribución de la población de la que se ha extraído la muestra. Contrastes de Bondad de Ajuste para conocer la forma de la población que ha originado la muestra. Las pruebas de bondad de ajuste se utilizan para contrastar si los datos de la muestra pueden considerarse que proceden de una determinada distribución.
web: http://www.uv.es/friasnav/
2
SUPUESTOS DE LAS PRUEBAS PARAMÉTRICAS 1. Normalidad. Las observaciones se extraen de poblaciones distribuidas según la Normal para cada grupo. Pruebas de bondad de ajuste. 2. Homocedasticidad. Las varianzas de los diferentes grupos tienen que ser iguales. Homogeneidad de varianzas. El numerador y el denominador de la prueba F son estimaciones de la misma varianza poblacional. Prueba de Levéne. Supuesto de esfericidad respecto a la homogeneidad de varianzascovarianzas según la prueba de Mauchley. 3. Respecto a los errores: 1. Los errores son independientes entre sí. 2. Se distribuyen según na Normal dentro de cada población del grupo N(0, σ2). Es decir, con media cero y varianzas equivalentes. 3. La ecuación estructural del modelo refleja una composición aditiva de las fuentes de variación. web: http://www.uv.es/friasnav/
3
ACTUACIONES. TOMA DE DECISIONES Cuando se tengan unos datos hay que comprobar en primer lugar los supuestos de las pruebas paramétricas. En concreto se analizará en primer lugar si los datos de la variable tienen una distribución normal. Para ello se utilizarán gráficos y pruebas de contraste de la normalidad. Actuaciones: 1. Si se acepta la normalidad de las observaciones entonces se aplicará el contraste paramétrico adecuado para la hipótesis. 2. Si se rechaza la normalidad de las observaciones entonces se optará por aplicar pruebas no paramétricas donde los test se plantean sobre la mediana de la distribución: 1. Test de los rangos signos de Wilcoxon para una muestra. Contrasta la mediana de la muestra con la mediana poblacional. También permite contrastar la mediana de dos muestras pareadas. 2. Test U de Mann-Whitney para muestras independientes 4 web: http://www.uv.es/friasnav/
Pruebas de bondad de ajuste Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se ajustan a una determinada distribución.
Pruebas de Normalidad: -pruebas gráficas basadas en gráficos de normalidad como Q-Q plots. -Test de Kolmogorov –Smirnov de bondad de ajuste. Es válido sólo para variables aleatorias continuas. - Test de Lillefors. Es el Test de Kolmogorov –Smirnov con la corrección de Lillefors. Sus valores son menores que los de Kolmogorov. -Prueba de Shapiro-Wilks. Cuando se ejecutan las pruebas con el SPSS se obtiene el valor del estadístico y el valor p de probabilidad del contraste. Se rechaza H0 si el valor p de probabilidad es menor que el nivel de significación elegido para ejecutar la prueba de contraste estadístico. web: http://www.uv.es/friasnav/
5
DISTRIBUCIÓN NORMAL DE LAS PUNTUACIONES Evaluar mediante inspección visual la normalidad de las puntuaciones Los gráficos ayudan al investigador a juzgar si sus datos proceden de una distribución normal. Por ejemplo, si los datos proceden de una distribución normal cabe esperar que la distribución no tendrá una fuerte asimetría. Sin embargo, con pocos datos no es fácil obtener conclusiones consistentes y de ahí que se hayan ideado gráficos concretos para observar la normalidad de las puntuaciones de una variable.
web: http://www.uv.es/friasnav/
6
Gráficos para observar la normalidad de las puntuaciones de una variable: -Gráficos de probabilidad normal P-P plots -Gráficos de cuantiles normales Q-Q plots Estos gráficos trabajan con los datos estandarizados y ordenados. Cuando los datos se representan frente a los datos esperados de una distribución N (0, 1) se deben obtener puntos alineados en la diagonal de un cuadro.
web: http://www.uv.es/friasnav/
7
DISTRIBUCIÓN NORMAL DE LAS PUNTUACIONES
Histograma Gráfico de caja
Gráfico Q-Q
Observar la simetría de la distribución
Evaluar mediante inspección visual la normalidad de las puntuaciones web: http://www.uv.es/friasnav/
8
SPSS: Gráficos con pruebas de normalidad: ANALIZAR--ESTADÍSTICOS DESCRIPTIVOS-EXPLORAR
web: http://www.uv.es/friasnav/
9
Se puede seleccionar solamente ESTADÍSTICOS, solamente GRÁFICOS o que el SPSS ofrezca AMBOS (estadísticos y gráficos) en su salida de resultados.
web: http://www.uv.es/friasnav/
10
web: http://www.uv.es/friasnav/
11
Asimetría de la distribución ASIMETRÍA POSITIVA Examen difícil, Salarios, Tiempo de Reacción
Asimetría positiva: concentración de casos en los valores inferiores de la distribución y cola extendida hacia los valores grandes.
ASIMETRÍA NEGATIVA Examen fácil
Asimetría negativa: concentración de casos en los valores altos y cola alargada hacia los valores inferiores de la distribución. web: http://www.uv.es/friasnav/
12
Asimetría de la distribución
web: http://www.uv.es/friasnav/
13
web: http://www.uv.es/friasnav/
14
web: http://www.uv.es/friasnav/
15
Evaluar utilizando la prueba de significación la normalidad de las puntuaciones
GRÁFICOS CON PRUEBA DE NORMALIDAD La aplicación de la prueba de normalidad muestra dos gráficos: (1) Normal Probability Plot: (gráfico Q-Q) donde a cada valor observado se le empareja con su valor esperado, procedente éste último de una distribución normal. Si la muestra es extraída de una población normal ambos valores se encontrarán en la misma línea recta. web: http://www.uv.es/friasnav/
16
Evaluar utilizando la prueba de significación la normalidad de las puntuaciones
GRÁFICOS CON PRUEBA DE NORMALIDAD Normal Probability Plot. Gráfico Q-Q --Se representan los cuantiles empíricos obtenidos en la muestra frente al cuantil correspondiente en la distribución Normal. --Si el gráfico muestra una relación cercana a una línea recta entonces se ‘sugiere’ que los datos proceden de una distribución Normal.
web: http://www.uv.es/friasnav/
17
Normal Probability Plot . Gráfico Q-Q Cuando la distribución observada en las puntuaciones se ajusta a la teórica entonces los puntos se representan en línea recta en la diagonal. Si el ajuste no es bueno entonces la distribución de las puntuaciones adopta otras formas:
A. Asimétrica a la derecha
B. Asimétrica a la izquierda
C. Leptocúrtica
web: http://www.uv.es/friasnav/
D. Platicúrtica
18
web: http://www.uv.es/friasnav/
19
Evaluar utilizando la prueba de significación la normalidad de las puntuaciones
GRÁFICOS CON PRUEBA DE NORMALIDAD (2) Detrended Normal Plot donde se muestran las desviaciones de los puntos con relación a una línea recta. Si la muestra ha sido extraída de una población normal los puntos deben situarse alrededor de una línea horizontal con el origen en el punto .00.
web: http://www.uv.es/friasnav/
20
web: http://www.uv.es/friasnav/
21
Inspección visual descriptiva
Gráfico de caja y bigotes
Límite Superior: por encima de ese límite las puntuaciones se consideran atípicas (outliers)
Q3= Tercer cuartil
Mediana
50% de las puntuaciones Límite Inferior: por debajo de ese límite las puntuaciones se consideran atípicas (outliers)
95% de las puntuaciones Q1= Tercer cuartil web: http://www.uv.es/friasnav/
22
Inspección visual descriptiva
Gráfico de caja y bigotes --Asimetría positiva: la mediana está más cerca de la parte inferior de la caja. --Asimetría negativa: la mediana está más cerca de la parte superior de la caja. Cuanto más larga sea la caja y los bigotes mayor variabilidad tienen los datos web: http://www.uv.es/friasnav/
23
Gráficos de distribución Las principales ventajas son la sencillez de interpretación, la extensión a cualquier tipo de distribución y, en el caso de la distribución normal, la facilidad de obtener el diagrama ya que está implementado en muchos paquetes estadísticos. Además, no requieren muestras tan numerosas como algunos tests de normalidad. El principal inconveniente es la subjetividad de la interpretación visual, ya que al contrario de los tests de normalidad numéricos no se concluye con una “p “ de probabilidad objetiva. web: http://www.uv.es/friasnav/
24
Pruebas de significación para contrastar la hipótesis de la normalidad de las puntuaciones de la población (variables aleatorias continuas):
Kolmogorov-Smirnov, Corrección de Lilliefors y Shapiro Wilks Los gráficos orientan sobre la procedencia o no de la muestra de una población normal. Sin embargo, es posible trabajar con una prueba estadística que certifique la normalidad o no de las variables. web: http://www.uv.es/friasnav/
25
Queremos contrastar, para un determinado nivel de confianza, la hipótesis nula de que los datos proceden de una población con distribución normal.
Hipótesis Nula H0: es que el conjunto de datos siguen una distribución normal. Hipótesis Alternativa H1: es que el conjunto de datos no sigue una distribución normal.
Si el valor del estadístico supera un determinado valor, que depende del nivel de significación con el que se quiera rechazar la hipótesis nula, entonces esa colección de datos no se distribuye según una distribución normal. web: http://www.uv.es/friasnav/
26
Lillierfors tabuló el estadístico de Kolmogorov-Smirnov para el caso más habitual en el que desconocemos la media y la varianza poblacional y se estiman a través de los datos muestrales. ----El SPSS utiliza esta prueba modificada. Los valores críticos se obtienen aplicando la corrección de significación propuesta por Lilliefors. No utilizaremos el de Kolmogorov-Smirnov sin la corrección de Lilliefors por resultar muy conservador (en casi todas las ocasiones se mantiene H0)
web: http://www.uv.es/friasnav/
27
Sin corrección de Lilliefors. SPSS: Pruebas No paramétricas—K-S de una muestra
web: http://www.uv.es/friasnav/
28
El estadístico de prueba Kolmogorov-Smirnov (KS68 =0.155, p