Ajuste 1 I Ciclo, 2015 1
AJUSTE 1 I ciclo, 2015 José Francisco Valverde Calderón Email:
[email protected] Sitio web: www.jfvc.wordpress.com
Profesor: José Francisco Valverde C
Introducción
Ajuste 1 I Ciclo, 2015 2
•El “Estudio de los datos cuantitativos de la población…” •La “Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades.” •Otra definición es: la Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para obtener conclusiones de dicha población. •Comúnmente dos tipos de estadísticas: •La estadística descriptiva, que se refiere a los métodos aplicables para describir un conjunto de observaciones (cuantitativas o cualitativas), por medio de la tabulación y presentación de datos (Quintana, C. 1996) •Ejemplo: Red geodésica oficial de Costa Rica Profesor: José Francisco Valverde C
Introducción
Ajuste 1 I Ciclo, 2015 3
La red de primer orden es definida por 33 vértices pasivos
Profesor: José Francisco Valverde C
Introducción
Ajuste 1 I Ciclo, 2015 4
Profesor: José Francisco Valverde C
Introducción
Ajuste 1 I Ciclo, 2015 5
•La estadística inferencial, que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una parte de la misma, que llamamos muestra. •La inferencia proporciona instrumentos estadísticos para obtener conclusiones y hacer generalizaciones válidas de la población en estudio, con base a la información obtenida en el muestreo. •Por ejemplo, se hace el reconocimiento de 7 vértices de la red geodésica de primer orden, seleccionados al azar**. •Con base a los resultados de las visitas, se determina la cantidad de vértices en buen y mal estado y se hace una inferencia sobre el estado de la red geodésica. •Nota: la inferencia estadística requiere el diseño de experimentos, los cuales se realizan con diferentes tipos de muestreos, que no se estudian en el curso. Profesor: José Francisco Valverde C
Elementos de estadística
Ajuste 1 I Ciclo, 2015 6
•Se habla de variables, cuando se hace referencia a características cuantitativas de la unidad estadística en estudio •Una variable aleatoria discreta, es una variable X la cual no puede tener resultados intermedios, toma valores aislados •Una variable aleatoria continua, es una variable X que, dentro de un intervalo, su magnitud puede dar lugar a cualquier valor (la variable puede tomar infinito número de valores en el intervalo) •La aplicación de la teoría de errores a la topografía y la geodesia, implica el estudio de variables continuas •Dada la naturaleza de este tipo de variables, la probabilidad de que asuma un valor particular dentro del intervalo es cero (0), ya que se trata de un caso favorable, en infinito número de opciones
1 P( X = Xo ) = = 0 ∞ Profesor: José Francisco Valverde C
Elementos de estadística
Ajuste 1 I Ciclo, 2015 7
•Es común que para determinar una determinada cantidad, se hagan una serie de observaciones de esa cantidad, por lo que se define el vector de observaciones l:
l = [l1 l2 T
l3 .... ln ]
•De esta forma, los valores li se encontrarán en un intervalo a,b, de forma que:
a ≤ li ≤ b
•n es el tamaño de la serie de mediciones
Profesor: José Francisco Valverde C
Elementos de estadística
Ajuste 1 I Ciclo, 2015 8
•Exactitud y Precisión •Debido a los errores aleatorios presentes en la mediciones, una medición repetida de la misma cantidad dará como resultado diferentes valores •Discrepancia es la diferencia algebraica entre dos mediciones de la misma cantidad •Las medidas precisas no son necesariamente valores exactos •La precisión de una medición se da cuando aparecen pequeñas discrepancias entre mediciones repetidas. •En general se supone que existen únicamente errores aleatorios. De esta forma, la tendencia es a dar mayor credibilidad a tales datos y llamar las medidas como precisas (aunque puedan que no sean exactas) Profesor: José Francisco Valverde C
Elementos de estadística
Ajuste 1 I Ciclo, 2015 9
•Precisión: grado de consistencia entre un grupo de mediciones •Se basa en los tamaños de las discrepancias en una serie de datos •El grado de precisión alcanzable depende de la condiciones del medio ambiente durante las mediciones, la calidad del equipo usado, experiencia del observador con el equipo y las técnicas de medición •Exactitud: medida de la aproximación absoluta de la cantidad medida con su valor verdadero •Como el valor verdadero es una cantidad que no puede ser conocida, la exactitud es una incógnita •Población: es el conjunto de todas las unidades estadísticas. Este puede ser una población finita, como la cantidad de participantes inscritos en un evento o infinita •Muestra: Es un subconjunto de datos tomados de una población. Se selecciona con propósitos de efectuar estudios e inferir resultados Profesor: José Francisco Valverde C
Elementos de estadística
Ajuste 1 I Ciclo, 2015 10
Alta precisión
Alta precisión
Baja precisión
Baja exactitud
Alta exactitud
Baja exactitud
Profesor: José Francisco Valverde C
2.1 Promedio simple y promedio general
4.1. Promedio simple y promedio general
Ajuste 1 I Ciclo, 2015 11
•A los valores obtenidos en una serie de n mediciones, con n finito, pueden hacerse corresponder puntos en la recta orientada de números reales
•Por la presencia de los errores aleatorios, todos los resultados se ubicarán en forma dispersa dentro de un intervalo limitado por un valor mínimo y otro máximo •Los resultados de la mediciones corresponden a valores de una variable aleatoria, y se ubican como componentes del vector de observaciones L Profesor: José Francisco Valverde C
Pesado
2.1 Promedio simple y promedio general
4.1. Promedio simple y promedio general
Ajuste 1 I Ciclo, 2015 12
•El promedio simple se define para una serie de mediciones realizadas con la misma exactitud. •Si dentro de la serie hay mediciones con exactitudes diferentes, tal es el caso en el que se utilizan diferentes equipos de medición o metodologías, el promedio se define de forma general como el promedio pesado o ponderado. n
Lˆ =
∑pL i =1 n
i
i
∑p i =1
T
e PL = T e Pe
i
•pi : peso de la observación Li •P: matriz de los pesos de las observaciones, diagonal para el caso de observaciones independientes, sin correlación Profesor: José Francisco Valverde C
4.1. Promedio simple y promedio general
Ajuste 1 I Ciclo, 2015 13
•Medidas de tendencia central •La media (poblacional o muestral) •La mediana •La moda La mediana •Se le conoce también como media posicional. Es el valor que esta a la mitad del conjunto de datos, una vez que estos han sido ordenados de menor a mayor (la mitad de las observaciones estará sobre la mediana y la otra mitad por debajo de la mediana)
Si n es impar:
n +1 Me = 2
Si n es par:
n n + + 1 2 2 Me = 2 Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 14
4.1. Promedio simple y promedio general
Media poblacional X 1 + X 2 + X 3 + ...... + X n µ= n
Media muestral X 1 + X 2 + X 3 + ...... + X n X= n
n
Xi µ =∑ i =1 n
Xi X =∑ i =1 n
1 n µ = ∑ Xi n i =1
1 n X = ∑ Xi n i =1
n
Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 15
4.1. Promedio simple y promedio general La Moda •Es el valor que mas se repite dentro de un conjunto de datos. •Es el valor que se obtiene con mas frecuencia. •Ejemplo:
Profesor: José Francisco Valverde C
2.2 Valor mas probable y valor verdadero
4.2. Valor más probable y valor verdadero
Ajuste 1 I Ciclo, 2015 16
•Si se realiza una cantidad de observaciones que tienda a infinito (n ∞), la muestra tiende a la población y el promedio es un valor inmejorable. •A este valor se le denomina valor más probable y se puede decir que es un promedio óptimo. •En la estadística matemática se le llama esperanza matemática o valor esperado. •Li = observación i •n = cantidad de observaciones n 1 lim Li = µ L = E L •L = variable aleatoria n →∞ n •µL = valor verdadero i =1 •E{L}= Esperanza matemática
∑
{ }
Profesor: José Francisco Valverde C
4.2. Valor más probable y valor verdadero
Ajuste 1 I Ciclo, 2015 17
•Valor verdadero: Es el valor exacto de una magnitud. Es un valor teórico y salvo algunos casos especiales, en general no se conoce •Error verdadero: Es la diferencia entre una medida individual y el valor verdadero •Valor mas probable: Es el valor de una cantidad que basado en la serie de mediciones realizadas, tiene la más alta probabilidad de ocurrencia •Grados de libertad: es el número de observaciones superabundantes o redundantes, que sobredeterminan un problema •Residuo: es la diferencia entre cualquier valor medido y el valor más probable de una cantidad. Un residuo NO es un error •Las medidas de dispersión indican que tanto se dispersan las observaciones alrededor de la media •Rango: es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 18
Diferencias entre los distintos valores Entre valor más probable y valor verdadero, error sistemático
∆ = µ L − Lɶ Entre una observación y el valor verdadero, error verdadero
ɶ η = Li − L
matemática
Entre una observación y el valor más probable, error accidental o casual
ε = Li − µ L
matemática
Entre el promedio y las observaciones, residuo o corrección
vi = Lˆ − Li
geodesia
Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 19
4.3. Varianza y desviación estándar Varianza de una población σ2:
X1 − µ ) + ( X 2 − µ ) + ( X 3 − µ ) ( σ = 2
2
2
2
+ .... + ( X n − µ )
2
n
n
σ =∑ 2
( Xi − µ )
n
2
1 2 σ = ∑( Xi − µ ) n i= i =1 2
n
i =1
Desviación estándar de una población σ:
( X1 − µ ) + ( X 2 − µ ) + ( X 3 − µ ) 2
σ =±
σ =± σ
2
2
+ .... + ( X n − µ )
2
( Xi − µ )
2
n 2
σ =±
n
∑ i =1
n
Ajuste 1 I Ciclo, 2015 20
4.3. Varianza y desviación estándar Varianza de una muestra s2:
s
2
X ( = n
s2 = ∑
− X ) + ( X 2 − X ) + ( X 3 − X ) + .... + ( X n − X ) 2
1
2
2
n −1
( Xi − X )
2
n 2 1 2 s = Xi − X ) ( ∑ n − 1 i= i =1
n −1
i =1
2
Desviación estándar de una muestra s:
s=±
s=±
(X
− X ) + ( X 2 − X ) + ( X 3 − X ) + .... + ( X n − X ) 2
1
2
2
2
n −1 n
∑ i =1
( Xi − X ) n −1
2
2 1 n s=± Xi − X ) ( ∑ n − 1 i =1
4.3. Varianza y desviación estándar
Ajuste 1 I Ciclo, 2015 21
Desviación estándar de un promedio •Debido a que todos los valores medidos contienen errores, el promedio que se calcula para una muestra también contendrá un error, el cual se estima mediante el cálculo de la desviación estándar del promedio:
s sX = ± n
Profesor: José Francisco Valverde C
Algunas funciones estadísticas con Matlab
Ajuste 1 I Ciclo, 2015 22
•Operaciones matriciales en Matlab: •Nota: se parte de que las dimisiones de las matrices permiten la operación a efectuar. •max(x): encuentra el valor mas grande del vector x •[a,b] = max(x): devuelve el valor mas grande del vector x y su ubicación •min(x): encuentra el valor mas pequeño del vector x •[a,b] = min(x): devuelve el valor mas pequeño del vector x y su ubicación •mean(x): encuentra el promedio vector x •median(x): encuentra la mediana del vector x •sum(x): suma los elementos del vector x •std(x): calcula la desviación estándar del conjunto de datos en x •var(x): calcula la varianza del conjunto de datos en x Profesor: José Francisco Valverde C
Concepto de peso y cofactor
Ajuste 1 I Ciclo, 2015 23
•El cofactor y el peso son parámetros que también se utilizan para describir las características aleatorias o estocásticas de las observaciones •El peso pi de una observación se define como el recíproco de la varianza de esa observación
1
1 pi = 2 si
pi =
s p = s
σ p = σ
σ
2 i •El peso se puede definir en forma general como una constante dividida por la varianza; si se introduce como constante la varianza de la unidad de peso, el peso de la observación queda expresado como: 2 2 0 0 i i 2 2 i i Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 24
Concepto de peso y cofactor
•El cofactor qi de una observación Li se define como el inverso del peso.
1 1 pi = → qi = qi pi
si2 σ i2 qi = 2 ; qi = 2 s0 σ0
•Los conceptos de peso y cofactor aplicados a matrices de varianzacovarianza en el caso del vector aleatorio de dimensión n conduce a las relaciones: Matriz de cofactores empíricos de las observaciones
Matriz de cofactores teóricos de las observaciones
Matriz de pesos de las observaciones
1 Qll = 2 Sll s0
1 Qll = 2 Σll s0
Pll = Qll
−1
Profesor: José Francisco Valverde C
4.4. Coeficiente de correlación
Ajuste 1 I Ciclo, 2015 25
•Correlación significa dependencia entre dos variables aleatorias, mide la dependencia estocástica entre dos observaciones y se expresa mediante el coeficiente de correlación, que para el caso empírico es
rij =
sij si s j
∀i ≠ j
rij: coeficiente de correlación entre Li y Lj. si, sj: desviaciones estándar de Li y Lj. sij: covarianza
• Coeficiente de correlación en el caso teórico
σ ij ρij = σ iσ j
∀i ≠ j
ρij: coeficiente de correlación entre Li y Lj. σi, σj: desviaciones estándar de Li y Lj. σij: covarianza entre Li y Lj.
•La idea de la correlación surgió en 1888 de F. Galton a partir de estudios en el campo de la biología y meteorología. Profesor: José Francisco Valverde C
4.4. Coeficiente de correlación
Ajuste 1 I Ciclo, 2015 26
•El coeficiente de correlación se encuentra entre dos valores extremos
-1 < r < + 1 •Considerando el coeficiente de correlación en la matriz de varianzacovarianza teórica, esta queda expresada de la forma general que se tiene en la diapositiva siguiente •La matriz SLL es simétrica y por lo tanto vale sij = sji y rij = rji para todo i diferente de j •Vale algo semejante para la matriz empírica SLL, sustituyendo las s por σ y las r por ρ
Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 27
4.4. Coeficiente de correlación
Σ LL =
σ21
ρ12σ1σ2
ρ13σ1σ3
.
.
.
ρ1nσ1σn
ρ21σ2σ1
σ22
ρ21σ2σ1
.
.
.
ρ2nσ2σn
ρ31σ3σ1
ρ32σ3σ2
σ23
.
.
.
ρ3nσ3σn
.
. . RECORDAR LA. DEFINICIÓN
σ ij. ρij = σ iσ. j . .
ρ n1σnσ1
.
.
.
∀ i ≠ j ⇒ σ ij = ρij ⋅ σ iσ j .
ρ n2σnσ2 ρ n3σnσ3
.
.
.
.
.
.
σ 2n Profesor: José Francisco Valverde C
4.4. Coeficiente de correlación
Ajuste 1 I Ciclo, 2015 28
Ejemplos de correlación en geodesia Correlación empírica entre las distancias medidas desde un punto poligonal al punto atrás y al punto adelante. A
C
S1
S2
B
Correlación entre las distanicas S1 y S 2 r1,2
Correlación empírica entre los dos ángulos medidos en una estación D
2
1
C
A B
Correlación entre los ángulos r1,2
1
y
2
Profesor: José Francisco Valverde C
(j)
L
Grado de dependencia entre dos variables aleatorias determinadas por series de observaciones L1(j)
L(j) =
L2(j)
L2(k)
L3(j)
L3(k)
.
L(k)
L1(k)
L(k) =
DEPENDENCIA NULA ENTRE jk
(j)
L(k)
L
=0
(j)
L
.
.
.
.
.
Ln(j)
Ln(k)
L(k) ALTO NIVEL DE DEPENDENCIA ENTRE jk
=0
(j)
L
L(k)
Ajuste 1 I Ciclo, 2015 30
4.4. Coeficiente de correlación Regresión lineal en geodesia • Los casos más comunes de regresión se basan en funciones lineales, exponenciales y logarítmicas. En el caso lineal la función tendrá la forma y=mx+b
(j) Lc (j)
L
L
(k)
Siendo L(j) la variable dependiente y L(k) la variable independiente, se llama línea de regresión a la curva ( c ) = L(j) = f ( L(k) ) función de la forma explícita y = f ( x ) que cumple la condición Σ( Lc(j) - L(j) )2 = mínimo con Lc(j) = ordenada medida hasta la curva. Profesor: José Francisco Valverde C
4.5. Histogramas
Ajuste 1 I Ciclo, 2015 31
•Si se considera que X es una variable aleatoria continua, la cual obtiene valores como resultado de un experimento, las n mediciones conforman el vector de observaciones L. •Las n observaciones de la variable se encuentran dentro del intervalo •Los errores aleatorios no se pueden pronosticar, pero pueden deducirse algunas reglas sobre su comportamiento en base a la frecuencia con que se presentan en una serie de mediciones, lo que se puede visualizar en el gráfico conocido como histograma. •La serie de mediciones se divide en distintas clases de un ancho determinado ∆x y se determina la frecuencia con que se da un resultado dentro de cada clase. Con las clases y la frecuencia se construye el histograma Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 32
4.5. Histogramas
b − a) ( ∆x = m
•La cantidad de resultados dentro de cada clase i con el valor central xi, con i = 1 … m, se denomina frecuencia absoluta ki.
0 < ki < n
m
∑k
i
=n
i=1
•La relación entre ki y n se llama frecuencia relativa o función de frecuencia, y se puede utilizar en lugar de la frecuencia absoluta.
ki h( xi , ∆x) = , n
i = 1, 2, ... , n
ki hi = n
0 < hi < 1
m
∑h =1 i =1
i
Profesor: José Francisco Valverde C
4.5. Histogramas
Ajuste 1 I Ciclo, 2015 33
Profesor: José Francisco Valverde C
4.5. Histogramas 35 30 F R E C U E N C IA S ABS O LUTAS
Con la función de frecuencia relativa la suma de las frecuencias era igual a la unidad, y se puede graficad en forma semejante al caso absoluto
HISTOGRAMA
25 20 15 10 5 0 90
100
110
120
130
140
150
INTERVALOS DE CLASE
Con n tendiendo a infinito, la muestra tiende a la población, la función de la frecuencia relativa tiende hacia un límite llamado probabilidad, la función correspondiente se llama función de probabilidad.
ki P { xi , ∆x} = lim h ( xi , ∆x ) = n →∞ n
P ( xi , ∆x ) f ( x ) = lim ∆x → dx ∆x
Dividiendo la función de probabilidad por ∆x y haciéndolo tender a dx se obtiene Profesor: la función de densidad de probabilidad. José Francisco Valverde C
4.6. Funciones de distribución y de densidad
Ajuste 1 I Ciclo, 2015 35
La distribución normal •Si el tamaño de las mediciones tendiera a infinito y representan en un histograma con intervalos diferenciales (cada vez pequeños) ∆x dx, la curva del histograma tendería a ser una línea continua en forma de campana. •Gauss la llamó curva de error y dedujo su función a partir del cálculo de probabilidades, usando los errores aleatorios en vez de las observaciones en el eje x y las frecuencias en el eje y. •La forma de distribución de los errores aleatorios se llama distribución normal •Si una variable aleatoria siguen una distribución normal se indica:
L ∼ N ( µ ,σ
2
)
Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 36
4.6. Funciones de distribución y de densidad f (ε)
0 4 .
5
0 4 .
0 3 .
5
0 3 .
0 2 .
5
0 2 .
0 1 .
5
0 1 .
ε
0 0 . 5
0 -4
-3
-2
1 f (ε ) = e σ 2π
1 -
ε2 − 2 2σ
0
0
ε: e: s: f(ε):
1
2
3
4
error casual Li – m base de los logaritmos naturales desviación estándar teórica función de densidad probabilidad de la distribución de los errores e
4.6. Funciones de distribución y de densidad
Ajuste 1 I Ciclo, 2015 37
•El comportamiento aleatorio de cada serie se describe por la función de densidad y dependerá de la desviación estándar de cada serie. •En la figura siguiente se muestran tres curvas de distribución normal para valores de desviaciones estándar: menor que la unidad, igual a la unidad y mayor que la unidad. FUNCION DE DENSIDAD PARA DIFERENTES DESVIACIONES ESTÁNDAR TEÓRICAS 0 , 4 5
0 , 4
0 , 3 5
0 , 3
sigma < 1 0 , 2 5
sigma = 1 0 , 2
sigma > 1 0 , 1 5
0 , 1
0 , 0 5
0
- 4
- 3
- 2
- 1
0
1
2
3
4
La distribución normal estándar
Ajuste 1 I Ciclo, 2015 38
•Es una distribución normal que se puede vincular a cualquier distribución normal centrada mediante la siguiente transformación:
ε y= σ
•Los valores de y representan múltiplos de la desviación estándar teórica de la serie de observaciones, la distribución normal general se normaliza en σ. •La distribución normal estándar es una distribución normal con el valor especial σ = 1. • Llevando los valores de y al eje x se obtiene una curva cuya ecuación se denomina función de densidad de la distribución normal estándar. Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 39
Función de densidad de la distribución normal 0.5 0.4 0.3
ϕ ( y)
0.2 0.1 0.0
-4
-3
-2
-1
0
1
1 ϕ ( y) = e 2π
2
3
4
y2 − 2 Profesor: José Francisco Valverde C
La distribución normal estándar
Ajuste 1 I Ciclo, 2015 40
•Si los errores se distribuyen según la distribución normal estándar, entonces se dice que las observaciones siguen una distribución normal estándar o estandarizada:
L ∼ N ( 0,1) •Con la función de densidad de la distribución normal y de la distribución normal estándar se pueden calcular probabilidades. Este cálculo se basa en el área bajo la curva entre los límites -∞ y +∞. •Con este concepto de probabilidad el área total bajo la curva entre esos límites representa el 100% de probabilidad, la unidad, la certeza, ya que la totalidad de los resultados posibles de una serie de mediciones se deben ubicar dentro de los límites. Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 41
Probabilidades para distintos intervalos 0 .2
5
0 .2
0 .1
5
0 .1
0 .0 5
0
3 -
P {−σ < ε < σ } = 68%
P {−σ > ε > σ } = 32%
a 2 -
-σ 1 -
0
0
4 -
σ
1
P {−2σ < ε < 2σ } = 95% P {−2σ > ε > 2σ } = 5%
P {−∞ < ε < ∞} = 100%
b 2
3
4
P {−3σ < ε < 3σ } = 99, 7% P {−3σ > ε > 3σ } = 0,3%
P {a < ε < b} = P Profesor: José Francisco Valverde C
Normalización
Ajuste 1 I Ciclo, 2015 42
•En las computadoras y las calculadoras se tienen integradas las rutinas de la funciones de densidad y de distribución de la distribución normal estándar. •En la gran mayoría de los libros dedicados a la estadística igualmente se tienen tablas con estos valores. •La transformación entre una distribución normal cualquiera y la distribución normal estándar se realiza por medio de la relación conocida como normalización:
ε y= σ
;
y=
(x − µ)
σ
•Los parámetros fundamentales de una distribución normal son el valor más probable µ como valor central y la varianza σ2. Profesor: José Francisco Valverde C
Probabilidad e incertidumbre
Ajuste 1 I Ciclo, 2015 43
•En el estudio estadístico de ciertos eventos es usual establecer un nivel de confianza que equivale a la probabilidad o en su defecto el nivel de incertidumbre. •Entre la probabilidad y el nivel de incertidumbre existe la siguiente relación.
P=1–α •La relación anterior vale cuando se aplica una cola de la distribución. •Si se aplican dos colas simétricas de la distribución, la relación entre probabilidad e incertidumbre está dada por la siguiente igualdad.
P = 1 – 2*α/2 Profesor: José Francisco Valverde C
0 2 .
Ajuste 1 I Ciclo, 2015 44
5
0 2 .
0 1 .
Una cola
5
0 1 .
P 0 0 . 5
α 0
-4
-3
-2
-1
0
1
2
3
4
0 .2
5
0 .2
0 .1
5
0 .1
P
Dos colas α/2
α/2
0 .0 5
0
4 -
3 -
2 -
1 -
0
1
2
3
4
Profesor: José Francisco Valverde C
La distribución t de Student
Ajuste 1 I Ciclo, 2015 45
•Se aplica cuando en la serie de n mediciones de una variable aleatoria se determina la desviación estándar empírica como estimación de la teórica, al normalizar los errores casuales dividiendo por la desviación estándar empírica se obtiene la variable t. t=
ε
s •La variable t no se comporta según la distribución normal, sino que según la distribución t-Student. •La distribución depende de los grados de libertad f y para su determinación deben distinguirse dos casos. •f = n, cuando la desviación estándar s se calcula con errores verdaderos ε. •f = n – 1, cuando la desviación estándar s se calcula con los residuos v. Profesor: José Francisco Valverde C
La distribución t de Student
Ajuste 1 I Ciclo, 2015 46
•La función de densidad (la curva) de la distribución normal estándar es única, pero la de la distribución t varía en función de los grados de libertad. •Cuando n tiende a infinito, la distribución t tiende la distribución normal estándar.
Profesor: José Francisco Valverde C
Ji
Ajuste 1 I Ciclo, 2015 47
La distribución ji-cuadrado
•Dada una cantidad de variables aleatorias que siguen la distribución normal estándar, si se hace la suma de sus cuadrados se obtiene una nueva variable aleatoria cuya distribución se denomina ji-cuadrado
ε n 1 n 2 2 y j = ∼ N ( 0,1) → χ n = ∑ j =1 y = 2 ∑ j =1 ε 2j σ σ χ n2 = n χ =f 2 f
s2
σ
2
s2
σ2
cuando s2 se calcula con errores verdaderos ε. cuando s2 se calcula con los residuos ( f = n – 1 )
Profesor: José Francisco Valverde C
La distribución F o de Fisher
Ajuste 1 I Ciclo, 2015 48
•El cociente de dos parámetros independientes entre si con distribución jicuadrado, define una nueva variable aleatoria F:
χ f2
s
f1
σ
1
Ff1 ,f2 =
χ
2 f2
f2
2 1 2 1 2 2 2 2
2 1 2 2
s = = s s
σ
•La variable F es el cociente de dos varianza empíricas. Su comportamiento se describe 2 σ 2 por medio de la función de densidad de la ⋅ 2 distribución Fisher o distribución F, que σ 1 depende de los grados de libertad f1 y f2 de las respectivas varianzas empíricas
Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 49
•Los intervalos de confianza dan el grado de confianza con que se logra una aproximación al valor teórico de una variable aleatoria determinada de forma “empírica”. •El cálculo de los intervalos de confianza se basa en el uso de la estadística matemática, para una determinada probabilidad, que por lo general para el 95% de confianza o 5% de incertidumbre.
P (a ≤ µ ≤ b) = 1− α P ( µ < a) = P ( µ > b) = α / 2 •Elegida la probabilidad o el nivel de incertidumbre, se calculan los valores (a, b) que definen el intervalo de confianza. Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 50
1-α = Probabilidad α= incertidumbre µ = valor verdadero
1-α
α/2 a
µ
α/2
b Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 51
Intervalo de confianza del valor más probable µ, con σ conocido (distribución normal) •Se parte de una distribución normal y se buscan los límites a y b del intervalo de confianza para µ, asumiendo que se conoce la σ de cada medida, por lo que el error del promedio σx se puede determinar como el cociente de σ entre la raíz cuadrada de n.
σx =
σ n
x − µ) ( y= ∼N
σx
( 0,1)
•Por simetría en la curva de la distribución normal
yα /2 = y1 −α /2
x − µ) ( P − y α ≤ ≤ y α = 1−α 1− 1− σ x 2 2 Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 52
x − σ x ⋅ y1− α ≤ µ ≤ x + σ x ⋅ y1− α = 1 − α 2 2 0 , 2 5
0 , 2
0 , 1 5
1- α 0 , 1
α/2 - 4
α/2
0 , 0 5
- 3
yα/2 - 2
Límites del intervalo de confianza
0
- 1
0 0
1
y1-α/2 2
3
4
a = x − y1−α /2 ⋅ σ x b = x + y1−α /2 ⋅ σ x
Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 53
Intervalo de confianza del valor más probable µ, con σ desconocido (distribución t) •Se estima σ a través de la desviación estándar empírica s calculada con los datos de la serie de mediciones, que siguen una distribución t. •La desviación estándar del promedio sx se calcula como el cociente de la desviación estándar empírica de la medición entre la raíz de n.
s sx = n x − µ) ( tf = sx f = n −1
Límites del intervalo de confianza
a = x − f f ,1−α /2 ⋅ sx b = x + t f ,1−α /2 ⋅ sx Profesor: José Francisco Valverde C 53
4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 54
•Para el caso del test global, se parte del hecho de que se ha hecho un ajuste con f-grados de libertad y que a partir de las n-observaciones se obtiene la varianza a posteriori de la unidad de pesos so2. •El cálculo del intervalo de confianza se hace de la siguiente forma:
a = so
f
χ
2 f ,1−
α 2
b = so
f
χ
2 f,
α 2
•a y b = valores extremos del intervalo de confianza •so = desviación estándar a posteriori de la unidad de pesos •f = grados de libertad •χ2 = cuantil de la distribución Chi-cuadrado Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 55
Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 56
Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza 2 A1 = λ1 χ 2,1 −α
A2 = λ2 χ w=
2 2,1−α
(σ − σ 2 1
2 2
Ajuste 1 I Ciclo, 2015 57
1 2 2 = σ 1 + σ 22 + w ) χ 2,1 ( −α 2
Calculo de elipses de confianza
1 2 2 2 σ σ χ w = + − ( ) 1 2 2,1−α 2
Las elipses representan una región de confianza, tal que con una probabilidad P = 1 α se puede asegurar estadísticamente que el punto, dado por sus coordenadas teóricas, esta dentro de esa elipse. Entre más pequeña y menos excéntrica es la elipse más confiable es la solución.
)
2
+ 4 σ 122
2 σ 12 1 Θ = arctan 2 2 2 σ1 − σ 2
• A1 = semieje mayor de la elipse (a) • A2 = semieje menor de la elipse (b) • Θ = ángulo de giro del semieje mayor
Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza a = σ0
1 2 q + q + w χ ( ) ˆˆ ˆˆ 2,1−α NN EE 2
B = σ0
1 2 q + q − w χ ( ) ˆˆ ˆˆ 2,1−α NN EE 2
w=
( qNNˆ ˆ − qEEˆ ˆ
)
2
2 + 4 qNE ˆˆ
2 qNE ˆˆ tan 2θ = qˆ ˆ −qˆˆ EE NN
•a = semieje mayor de la elipse (a) •b = semieje menor de la elipse (b) •θ = ángulo de giro del semieje mayor
Ajuste 1 I Ciclo, 2015 58
Calculo de elipses de confianza Caso teórico Los valores qNN, qEE, qNE se extraen de la matriz de factores y cofactores de las incógnitas ajustadas Qxx Para cada punto son los elementos de la submatriz cuadrada correspondiente a las coordenadas del punto.
Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza a = s0 b = s0 w=
(q (q
ˆˆ NN
+ qEE ˆ ˆ + w ) F2, f ,1−α
ˆˆ NN
+ qEE ˆ ˆ − w ) F2, f ,1−α
( qNNˆ ˆ − qEEˆ ˆ
)
2
2 + 4 qNE ˆˆ
2 qNE ˆˆ tan 2θ = qˆ ˆ −qˆˆ EE NN
•a = semieje mayor de la elipse (a) •b = semieje menor de la elipse (b) •θ = ángulo de giro del semieje mayor
Ajuste 1 I Ciclo, 2015 59
Calculo de elipses de confianza Caso empirico Los valores qNN, qEE, qNE se extraen de la matriz de factores y cofactores de las incógnitas ajustadas Qxx Para cada punto son los elementos de la submatriz cuadrada correspondiente a las coordenadas del punto.
Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 60
Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 61
Profesor: José Francisco Valverde C
4.7. Intervalos y regiones de confianza
Ajuste 1 I Ciclo, 2015 62
Profesor: José Francisco Valverde C
2.8 Test estadísticos
Ajuste 1 I Ciclo, 2015 63
4.8. Test estadísticos
•Es usual en topografía y geodesia tener como resultados dos determinaciones independientes de una misma variable aleatoria, por ejemplo, la distancia entre dos puntos A y B. •Surge la pregunta de que si ambas determinaciones: •Son coincidentes y que la diferencia numérica es natural por la presencia de los errores casuales en las mediciones. •O que discrepan significativamente, eventualmente por un desplazamiento del punto A, del punto B, o de ambos. •La decisión para dar una respuesta o la otra puede tomarse con respaldo en una prueba o test estadístico. •En el ejemplo de la distancia se asume que ambas determinaciones siguen una distribución normal:
(
2 ɶ L1 ∼ N L1 , σ
)
(
2 ɶ L2 ∼ N L2 , σ
)
Profesor: José Francisco Valverde C
Hipótesis
4.8. Test estadísticos
Ajuste 1 I Ciclo, 2015 64
•En teoría, el valor central es el valor verdadero, pero en la práctica lo que se obtiene es el valor ajustado o promediado de la variable aleatoria. •La comparación de ambos resultados conduce al planteamiento de dos hipótesis: una hipótesis nula H0 y una hipótesis alternativa HA1 o HA2.
H 0 : Lˆ1 = Lˆ2 H : Lˆ < Lˆ A1
1
2
H A 2 : Lˆ1 ≠ Lˆ2 •En la hipótesis nula se plantea que ambos resultados son coincidentes; aunque exista diferencia numérica no es significativa y es atribuible a la dispersión natural de los errores en las observaciones. Profesor: José Francisco Valverde C
Ejemplo
4.8. Test estadísticos
Ajuste 1 I Ciclo, 2015 65
•La primera hipótesis alternativa se plantea cuando se espera con cierto fundamento un incremento en el valor de la variable, es decir, un cambio positivo. •La segunda hipótesis alternativa se plantea cuando se asume que pueden haber cambios en los resultados que pueden ser tanto positivos como negativos. •Las hipótesis deben someterse a pruebas o test estadísticos para comprobar su validez. •Para el planteamiento del test debe partirse de que las variables siguen una distribución conocida. •En el ejemplo de la distancia ambas determinaciones siguen una distribución normal, por lo cual su diferencia también seguirá una distribución normal. •Si d es la diferencia entre los dos promedios y σd la desviación Profesor: estándar del promedio: José Francisco Valverde C
Decisión
Ajuste 1 I Ciclo, 2015 66
4.8. Test estadísticos
σ d = σ 12 + sσ 22
d = Lˆ1 − Lˆ2 H0 : y = y: sd:
d
σd
∼ N ( 0,1)
HA : y =
d
σd
∼ N ( yˆ ,1)
estadístico o valor de prueba. desviación estándar de la diferencia, obtenida por medio de propagación de errores
•Bajo la hipótesis nula, y sigue una distribución normal estándar, centrada en el origen y con desviación estándar igual a uno. •Bajo la hipótesis alternativa la distribución es normal pero no estándar, con el valor central igual a la diferencia d estandarizada con la desviación estándar. Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 67
Región de aceptación y rechazo para el estadístico por medio del test de UNA COLA ϕ0(y)
ϕA(y)
REGIÓN DE ACEPTACIÓN
REGIÓN DE RECHAZO
cuantil 1− α
α 0
y1-α
y ≤ y1−α ⇒ H0 : no se rechaza
y
y > y1−α ⇒ H0 : se rechaza Profesor: José Francisco Valverde C
Región de aceptación y rechazo para el estadístico por medio del test de DOBLE COLA ϕ0(y)
ϕA(y)
REGIÓN DE ACEPTACIÓN
REGIÓN DE RECHAZO
Ajuste 1 I Ciclo, 2015 68
REGIÓN DE RECHAZO
cuantil cuantil
α/2 yα/2
y ≤ yα /2 ⇒ H0 : se rechaza
α/2 0
y1-α/2
y
y ≥ y1−α /2 ⇒ H0 : se rechaza
yα /2 ≤ y ≤ y1−α /2 ⇒ H0 : no se rechaza
Profesor: José Francisco Valverde C
Ajuste 1 I Ciclo, 2015 69
4.8. Test estadísticos Pasos generales para la aplicación de un test estadístico
•Formular la hipótesis nula y la hipótesis alternativa. •Calcular del estadístico o valor de prueba a partir de las observaciones que siguen una determinada distribución. •Elegir el nivel de incertidumbre a y determinar los límites entre las regiones de aceptación y rechazo a partir de los valores de distribuciones estadísticas para un test de una cola o de dos colas. •Decidir si la hipótesis nula se acepta o se rechaza, es decir, si el estadístico se encuentra en la zona de aceptación o de rechazo.
Profesor: José Francisco Valverde C
Decisión
Ajuste 1 I Ciclo, 2015 70
4.8. Test estadísticos
4.8.1 Test de significancia para la diferencia de dos promedios, caso con mediciones de la misma varianza •Se hacen una serie de mediciones para las variables aleatorias L1 y L2, que son las componentes de los vectores de observaciones respectivos.
L = [l1 , l2 , l3 ,.....lm ]
L = [l1 , l2 , l3 ,.....ln ]
T 1
T 2
E { L1} =µ1
E { L2 } =µ2
•A través de un test se debe decidirse cuál de las siguientes hipótesis se acepta. Hipótesis nula: Hipótesis alternativas
H0 : HA1: HA2:
µ1 = µ2 µ1 < µ2 µ1 ≠ µ2
Test de 1 cola Test de 2 colas Profesor: José Francisco Valverde C
Decisión
Ajuste 1 I Ciclo, 2015 71
4.8. Test estadísticos 1. Cálculo de los promedios empíricos y la diferencia:
1 T xˆ1 = e L1 m
1 T xˆ2 = e L2 n d = xˆ2 − xˆ1
H0: HA1: HA2:
E{d} = 0 E{d} > 0 E{d} ≠ 0
2. Cálculo de la desviación estándar empírica de la diferencia:
v1 = e ⋅ xˆ1 − Li
i = 1, 2,...., m T v v 2 s1 = m −1
v2 = e ⋅ xˆ2 − Li
i = 1, 2,...., n
T v v 2 s2 = n −1
En este caso la σ2 es la misma para ambos conjuntos, s1 y s2 no son más que estimaciones de la varianza teórica σ2 E{s12 }= E{s22 } = σ2 Profesor: José Francisco Valverde C
Decisión
Ajuste 1 I Ciclo, 2015 72
4.8. Test estadísticos
T T + v v v 2 1 1 2 v2 s = m+n−2
Cálculo de la varianza común a las series de observaciones Por propagación de errores se calcula la desviación estándar de la diferencia d
1 1 sdˆ = s + m n
3. Cálculo del estadístico t que sigue una distribución Student bajo la hipótesis nula, con f = m+n-2, grados de libertad Hipótesis nula
Ho:
t≤q t>q
dˆ t= sdˆ
Ho no se rechaza Ho se rechaza
q: Cuantil de la distribución t, con q = tf,1-α: Test de 1 cola (HA1) q = tf,1-α/2: Test de 2 colas (HA2)
Profesor: José Francisco Valverde C
Decisión
4.8. Test estadísticos
Ajuste 1 I Ciclo, 2015 73
4.8.2 Test de significancia para la diferencia de dos promedios, caso con mediciones de diferente varianza •Se parte de que s12 ≠ s22, la derivación de un test (problema de Behrens-Fisher) es compleja y no existe una solución estricta. •1. Cálculo de las desviaciones estándar empíricas de los promedios, calculados de igual forma que en el caso anterior. 2 1
s s = m 2 xˆ1
2 2
s s = n 2 xˆ 2
•Cálculo de la varianza empírica de la diferencia d
sˆ = s + s 2
d
2 xˆ1
2 xˆ 2 Profesor: José Francisco Valverde C
Decisión
Ajuste 1 I Ciclo, 2015 74
4.8. Test estadísticos
2.
3. Determinación del estadístico o valor de prueba
dˆ t= sdˆ 4. Determinación de los grados de libertad f
f =
1
1− c) ( c + m − a n −1 2
2 xˆ1
2 xˆ1 2
s s c= 2 = 2 sxˆ1 + sxˆ 2 s ˆ d
5. Aplicación del test con base en la distribución de Student de igual forma que en el caso anterior Profesor: José Francisco Valverde C
Decisión
4.8. Test estadísticos
Ajuste 1 I Ciclo, 2015 75
4.8.3 Test de significancia para la varianza, comparación de dos varianzas empíricas •Se presenta cuando se tienen las varianzas empíricas de dos grupos de mediciones y se desea comprobar estadísticamente si corresponden a la misma exactitud o no, aunque difieran numéricamente. s12: s22:
Calculado para el primer grupo con f1 grados de libertad Calculado para el segundo grupo con f2 grados de libertad
•Para el planteamiento del test se asume que la varianza teórica σ2 es igual para ambos casos Hipótesis nula: Hipótesis alternativas
H0:
s 2 = s 12 = s 22 HA1: s12 > s22 Test de 1 cola HA2: s12 ≠ s22 Test de 2 colas
Decisión
4.8. Test estadísticos
Ajuste 1 I Ciclo, 2015 76
•Se calcula el estadístico F tomando como primer grupo y en el numerador el que tiene la mayor varianza. El cociente sigue una distribución de Fisher, con f1 y f2 grados de libertad.
2 1 2 2
s F= s
Cuantiles de la distribución Ff1,f2 : Ff1,f2,1- α (en las tablas) Ff1,f2,α/2 = 1 / Ff1,f2,1- α/2
Decisión en test de una cola: F > Ff1,f2,1 - α H0 se rechaza F ≤ Ff1,f2,1 - α H0 no se rechaza Decisión en test de dos colas: Ff1,f2,α/2 ≤ F ≤ Ff1,f2,1- α/2 H0 no se rechaza F < Ff1,f2,α/2 o F > Ff1,f2,1- α/2 H0 se rechaza
Profesor: José Francisco Valverde C
Decisión
Ajuste 1 I Ciclo, 2015 77
4.8. Test estadísticos
4.8.4 Test de significancia para la varianza, comparación de un grupo de varianzas empíricas •Con m-grupos de mediciones siendo m>2, se calcula la varianza empírica si2 para una sola medición en cada grupo. •Por medio del test se deberá probar si la exactitud en las mediciones refleja su homogeneidad. •El test se desarrolla de la siguiente forma: 1. Suma de los grados de libertad y el promedio pesado de las varianzas. m
f = ∑ fi i =1
m
1 2 s = ∑ f1si f i =1 2
Profesor: José Francisco Valverde C
Decisión
4.8. Test estadísticos
Ajuste 1 I Ciclo, 2015 78
2. Cálculo del factor de escala c para la normalización: m 1 1 1 c = 1+ ⋅ ∑ − 3 ( m − 1) i =1 fi f
3. Cálculo del estadístico B, que sigue una distribución χ2 siempre que fi no sea muy pequeño (fi ≥ 10):
1 2 2 B = f ⋅ ln ( s ) − ∑ fi .ln ( s1 ) c i =1 m
4. Reglas del test: Hipótesis nula
Ho:
B ≤ χ2m-1,1-α Ho no se rechaza B > χ2 m-1,1-α Ho se rechaza Profesor: José Francisco Valverde C