AJUSTE 1. I ciclo, José Francisco Valverde Calderón Sitio web:

Ajuste 1 I Ciclo, 2015 1 AJUSTE 1 I ciclo, 2015 José Francisco Valverde Calderón Email: [email protected] Sitio web: www.jfvc.wordpress.c

Author: Cristina Ojeda Ortíz

2 downloads 31 Views 1MB Size

Report

DOWNLOAD PDF

Recommend Stories

Sitio Web:

Sitio web materia:

Sede y localidad Sede Andina, San Carlos de Bariloche Carreras Licenciatura en Administración Licenciatura en Hotelería Licenciatura en Turismo Cuatri

VISITA NUESTRO SITIO WEB

QUIMICOS VISITA NUESTRO SITIO WEB www.technochevy.com.mx https://www.facebook.com/technochevy.web MATRIZ SANTA FE CAMINO A SANTA FE No 410 LOCAL A C

Sitio Web del STUNAM

REGLAMENTO. SITIO WEB. (www.rallydelgolfoalpacifico.com.mx)

Visita nuestro sitio web:

Visita nuestro sitio web: http://sitios.usac.edu.gt/cedesyd Boletín No. 1 Este boletín se edita en conmemoración de los 39 años del terremoto del 4

Imagen + bajada sitio web

Servicio Web. Administrador de sitio Web

o en su sitio web

0003 (Resp. Cont.) Sitio web:

Story Transcript

Ajuste 1 I Ciclo, 2015 1

AJUSTE 1 I ciclo, 2015 José Francisco Valverde Calderón Email: [email protected] Sitio web: www.jfvc.wordpress.com

Profesor: José Francisco Valverde C

Introducción

Ajuste 1 I Ciclo, 2015 2

•El “Estudio de los datos cuantitativos de la población…” •La “Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades.” •Otra definición es: la Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para obtener conclusiones de dicha población. •Comúnmente dos tipos de estadísticas: •La estadística descriptiva, que se refiere a los métodos aplicables para describir un conjunto de observaciones (cuantitativas o cualitativas), por medio de la tabulación y presentación de datos (Quintana, C. 1996) •Ejemplo: Red geodésica oficial de Costa Rica Profesor: José Francisco Valverde C

Introducción

Ajuste 1 I Ciclo, 2015 3

La red de primer orden es definida por 33 vértices pasivos

Profesor: José Francisco Valverde C

Introducción

Ajuste 1 I Ciclo, 2015 4

Profesor: José Francisco Valverde C

Introducción

Ajuste 1 I Ciclo, 2015 5

•La estadística inferencial, que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una parte de la misma, que llamamos muestra. •La inferencia proporciona instrumentos estadísticos para obtener conclusiones y hacer generalizaciones válidas de la población en estudio, con base a la información obtenida en el muestreo. •Por ejemplo, se hace el reconocimiento de 7 vértices de la red geodésica de primer orden, seleccionados al azar**. •Con base a los resultados de las visitas, se determina la cantidad de vértices en buen y mal estado y se hace una inferencia sobre el estado de la red geodésica. •Nota: la inferencia estadística requiere el diseño de experimentos, los cuales se realizan con diferentes tipos de muestreos, que no se estudian en el curso. Profesor: José Francisco Valverde C

Elementos de estadística

Ajuste 1 I Ciclo, 2015 6

•Se habla de variables, cuando se hace referencia a características cuantitativas de la unidad estadística en estudio •Una variable aleatoria discreta, es una variable X la cual no puede tener resultados intermedios, toma valores aislados •Una variable aleatoria continua, es una variable X que, dentro de un intervalo, su magnitud puede dar lugar a cualquier valor (la variable puede tomar infinito número de valores en el intervalo) •La aplicación de la teoría de errores a la topografía y la geodesia, implica el estudio de variables continuas •Dada la naturaleza de este tipo de variables, la probabilidad de que asuma un valor particular dentro del intervalo es cero (0), ya que se trata de un caso favorable, en infinito número de opciones

1 P( X = Xo ) = = 0 ∞ Profesor: José Francisco Valverde C

Elementos de estadística

Ajuste 1 I Ciclo, 2015 7

•Es común que para determinar una determinada cantidad, se hagan una serie de observaciones de esa cantidad, por lo que se define el vector de observaciones l:

l = [l1 l2 T

l3 .... ln ]

•De esta forma, los valores li se encontrarán en un intervalo a,b, de forma que:

a ≤ li ≤ b

•n es el tamaño de la serie de mediciones

Profesor: José Francisco Valverde C

Elementos de estadística

Ajuste 1 I Ciclo, 2015 8

•Exactitud y Precisión •Debido a los errores aleatorios presentes en la mediciones, una medición repetida de la misma cantidad dará como resultado diferentes valores •Discrepancia es la diferencia algebraica entre dos mediciones de la misma cantidad •Las medidas precisas no son necesariamente valores exactos •La precisión de una medición se da cuando aparecen pequeñas discrepancias entre mediciones repetidas. •En general se supone que existen únicamente errores aleatorios. De esta forma, la tendencia es a dar mayor credibilidad a tales datos y llamar las medidas como precisas (aunque puedan que no sean exactas) Profesor: José Francisco Valverde C

Elementos de estadística

Ajuste 1 I Ciclo, 2015 9

•Precisión: grado de consistencia entre un grupo de mediciones •Se basa en los tamaños de las discrepancias en una serie de datos •El grado de precisión alcanzable depende de la condiciones del medio ambiente durante las mediciones, la calidad del equipo usado, experiencia del observador con el equipo y las técnicas de medición •Exactitud: medida de la aproximación absoluta de la cantidad medida con su valor verdadero •Como el valor verdadero es una cantidad que no puede ser conocida, la exactitud es una incógnita •Población: es el conjunto de todas las unidades estadísticas. Este puede ser una población finita, como la cantidad de participantes inscritos en un evento o infinita •Muestra: Es un subconjunto de datos tomados de una población. Se selecciona con propósitos de efectuar estudios e inferir resultados Profesor: José Francisco Valverde C

Elementos de estadística

Ajuste 1 I Ciclo, 2015 10

Alta precisión

Alta precisión

Baja precisión

Baja exactitud

Alta exactitud

Baja exactitud

Profesor: José Francisco Valverde C

2.1 Promedio simple y promedio general

4.1. Promedio simple y promedio general

Ajuste 1 I Ciclo, 2015 11

•A los valores obtenidos en una serie de n mediciones, con n finito, pueden hacerse corresponder puntos en la recta orientada de números reales

•Por la presencia de los errores aleatorios, todos los resultados se ubicarán en forma dispersa dentro de un intervalo limitado por un valor mínimo y otro máximo •Los resultados de la mediciones corresponden a valores de una variable aleatoria, y se ubican como componentes del vector de observaciones L Profesor: José Francisco Valverde C

Pesado

2.1 Promedio simple y promedio general

4.1. Promedio simple y promedio general

Ajuste 1 I Ciclo, 2015 12

•El promedio simple se define para una serie de mediciones realizadas con la misma exactitud. •Si dentro de la serie hay mediciones con exactitudes diferentes, tal es el caso en el que se utilizan diferentes equipos de medición o metodologías, el promedio se define de forma general como el promedio pesado o ponderado. n

Lˆ =

∑pL i =1 n

i

i

∑p i =1

T

e PL = T e Pe

i

•pi : peso de la observación Li •P: matriz de los pesos de las observaciones, diagonal para el caso de observaciones independientes, sin correlación Profesor: José Francisco Valverde C

4.1. Promedio simple y promedio general

Ajuste 1 I Ciclo, 2015 13

•Medidas de tendencia central •La media (poblacional o muestral) •La mediana •La moda La mediana •Se le conoce también como media posicional. Es el valor que esta a la mitad del conjunto de datos, una vez que estos han sido ordenados de menor a mayor (la mitad de las observaciones estará sobre la mediana y la otra mitad por debajo de la mediana)

Si n es impar:

n +1 Me = 2

Si n es par:

n n    +  + 1 2 2   Me = 2 Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 14

4.1. Promedio simple y promedio general

Media poblacional X 1 + X 2 + X 3 + ...... + X n µ= n

Media muestral X 1 + X 2 + X 3 + ...... + X n X= n

n

Xi µ =∑ i =1 n

Xi X =∑ i =1 n

1 n µ = ∑ Xi n i =1

1 n X = ∑ Xi n i =1

n

Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 15

4.1. Promedio simple y promedio general La Moda •Es el valor que mas se repite dentro de un conjunto de datos. •Es el valor que se obtiene con mas frecuencia. •Ejemplo:

Profesor: José Francisco Valverde C

2.2 Valor mas probable y valor verdadero

4.2. Valor más probable y valor verdadero

Ajuste 1 I Ciclo, 2015 16

•Si se realiza una cantidad de observaciones que tienda a infinito (n ∞), la muestra tiende a la población y el promedio es un valor inmejorable. •A este valor se le denomina valor más probable y se puede decir que es un promedio óptimo. •En la estadística matemática se le llama esperanza matemática o valor esperado. •Li = observación i •n = cantidad de observaciones n 1 lim Li = µ L = E L •L = variable aleatoria n →∞ n •µL = valor verdadero i =1 •E{L}= Esperanza matemática

∑

{ }

Profesor: José Francisco Valverde C

4.2. Valor más probable y valor verdadero

Ajuste 1 I Ciclo, 2015 17

•Valor verdadero: Es el valor exacto de una magnitud. Es un valor teórico y salvo algunos casos especiales, en general no se conoce •Error verdadero: Es la diferencia entre una medida individual y el valor verdadero •Valor mas probable: Es el valor de una cantidad que basado en la serie de mediciones realizadas, tiene la más alta probabilidad de ocurrencia •Grados de libertad: es el número de observaciones superabundantes o redundantes, que sobredeterminan un problema •Residuo: es la diferencia entre cualquier valor medido y el valor más probable de una cantidad. Un residuo NO es un error •Las medidas de dispersión indican que tanto se dispersan las observaciones alrededor de la media •Rango: es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 18

Diferencias entre los distintos valores Entre valor más probable y valor verdadero, error sistemático

∆ = µ L − Lɶ Entre una observación y el valor verdadero, error verdadero

ɶ η = Li − L

matemática

Entre una observación y el valor más probable, error accidental o casual

ε = Li − µ L

matemática

Entre el promedio y las observaciones, residuo o corrección

vi = Lˆ − Li

geodesia

Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 19

4.3. Varianza y desviación estándar Varianza de una población σ2:

X1 − µ ) + ( X 2 − µ ) + ( X 3 − µ ) ( σ = 2

2

2

2

+ .... + ( X n − µ )

2

n

n

σ =∑ 2

( Xi − µ )

n

2

1 2 σ = ∑( Xi − µ ) n i= i =1 2

n

i =1

Desviación estándar de una población σ:

( X1 − µ ) + ( X 2 − µ ) + ( X 3 − µ ) 2

σ =±

σ =± σ

2

2

+ .... + ( X n − µ )

2

( Xi − µ )

2

n 2

σ =±

n

∑ i =1

n

Ajuste 1 I Ciclo, 2015 20

4.3. Varianza y desviación estándar Varianza de una muestra s2:

s

2

X ( = n

s2 = ∑

− X ) + ( X 2 − X ) + ( X 3 − X ) + .... + ( X n − X ) 2

1

2

2

n −1

( Xi − X )

2

n 2 1 2 s = Xi − X ) ( ∑ n − 1 i= i =1

n −1

i =1

2

Desviación estándar de una muestra s:

s=±

s=±

(X

− X ) + ( X 2 − X ) + ( X 3 − X ) + .... + ( X n − X ) 2

1

2

2

2

n −1 n

∑ i =1

( Xi − X ) n −1

2

2 1 n s=± Xi − X ) ( ∑ n − 1 i =1

4.3. Varianza y desviación estándar

Ajuste 1 I Ciclo, 2015 21

Desviación estándar de un promedio •Debido a que todos los valores medidos contienen errores, el promedio que se calcula para una muestra también contendrá un error, el cual se estima mediante el cálculo de la desviación estándar del promedio:

s sX = ± n

Profesor: José Francisco Valverde C

Algunas funciones estadísticas con Matlab

Ajuste 1 I Ciclo, 2015 22

•Operaciones matriciales en Matlab: •Nota: se parte de que las dimisiones de las matrices permiten la operación a efectuar. •max(x): encuentra el valor mas grande del vector x •[a,b] = max(x): devuelve el valor mas grande del vector x y su ubicación •min(x): encuentra el valor mas pequeño del vector x •[a,b] = min(x): devuelve el valor mas pequeño del vector x y su ubicación •mean(x): encuentra el promedio vector x •median(x): encuentra la mediana del vector x •sum(x): suma los elementos del vector x •std(x): calcula la desviación estándar del conjunto de datos en x •var(x): calcula la varianza del conjunto de datos en x Profesor: José Francisco Valverde C

Concepto de peso y cofactor

Ajuste 1 I Ciclo, 2015 23

•El cofactor y el peso son parámetros que también se utilizan para describir las características aleatorias o estocásticas de las observaciones •El peso pi de una observación se define como el recíproco de la varianza de esa observación

1

1 pi = 2 si

pi =

s p = s

σ p = σ

σ

2 i •El peso se puede definir en forma general como una constante dividida por la varianza; si se introduce como constante la varianza de la unidad de peso, el peso de la observación queda expresado como: 2 2 0 0 i i 2 2 i i Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 24

Concepto de peso y cofactor

•El cofactor qi de una observación Li se define como el inverso del peso.

1 1 pi = → qi = qi pi

si2 σ i2 qi = 2 ; qi = 2 s0 σ0

•Los conceptos de peso y cofactor aplicados a matrices de varianzacovarianza en el caso del vector aleatorio de dimensión n conduce a las relaciones: Matriz de cofactores empíricos de las observaciones

Matriz de cofactores teóricos de las observaciones

Matriz de pesos de las observaciones

1 Qll = 2 Sll s0

1 Qll = 2 Σll s0

Pll = Qll

−1

Profesor: José Francisco Valverde C

4.4. Coeficiente de correlación

Ajuste 1 I Ciclo, 2015 25

•Correlación significa dependencia entre dos variables aleatorias, mide la dependencia estocástica entre dos observaciones y se expresa mediante el coeficiente de correlación, que para el caso empírico es

rij =

sij si s j

∀i ≠ j

rij: coeficiente de correlación entre Li y Lj. si, sj: desviaciones estándar de Li y Lj. sij: covarianza

• Coeficiente de correlación en el caso teórico

σ ij ρij = σ iσ j

∀i ≠ j

ρij: coeficiente de correlación entre Li y Lj. σi, σj: desviaciones estándar de Li y Lj. σij: covarianza entre Li y Lj.

•La idea de la correlación surgió en 1888 de F. Galton a partir de estudios en el campo de la biología y meteorología. Profesor: José Francisco Valverde C

4.4. Coeficiente de correlación

Ajuste 1 I Ciclo, 2015 26

•El coeficiente de correlación se encuentra entre dos valores extremos

-1 < r < + 1 •Considerando el coeficiente de correlación en la matriz de varianzacovarianza teórica, esta queda expresada de la forma general que se tiene en la diapositiva siguiente •La matriz SLL es simétrica y por lo tanto vale sij = sji y rij = rji para todo i diferente de j •Vale algo semejante para la matriz empírica SLL, sustituyendo las s por σ y las r por ρ

Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 27

4.4. Coeficiente de correlación

Σ LL =

σ21

ρ12σ1σ2

ρ13σ1σ3

.

.

.

ρ1nσ1σn

ρ21σ2σ1

σ22

ρ21σ2σ1

.

.

.

ρ2nσ2σn

ρ31σ3σ1

ρ32σ3σ2

σ23

.

.

.

ρ3nσ3σn

.

. . RECORDAR LA. DEFINICIÓN

σ ij. ρij = σ iσ. j . .

ρ n1σnσ1

.

.

.

∀ i ≠ j ⇒ σ ij = ρij ⋅ σ iσ j .

ρ n2σnσ2 ρ n3σnσ3

.

.

.

.

.

.

σ 2n Profesor: José Francisco Valverde C

4.4. Coeficiente de correlación

Ajuste 1 I Ciclo, 2015 28

Ejemplos de correlación en geodesia Correlación empírica entre las distancias medidas desde un punto poligonal al punto atrás y al punto adelante. A

C

S1

S2

B

Correlación entre las distanicas S1 y S 2 r1,2

Correlación empírica entre los dos ángulos medidos en una estación D

2

1

C

A B

Correlación entre los ángulos r1,2

1

y

2

Profesor: José Francisco Valverde C

(j)

L

Grado de dependencia entre dos variables aleatorias determinadas por series de observaciones L1(j)

L(j) =

L2(j)

L2(k)

L3(j)

L3(k)

.

L(k)

L1(k)

L(k) =

DEPENDENCIA NULA ENTRE jk

(j)

L(k)

L

=0

(j)

L

.

.

.

.

.

Ln(j)

Ln(k)

L(k) ALTO NIVEL DE DEPENDENCIA ENTRE jk

=0

(j)

L

L(k)

Ajuste 1 I Ciclo, 2015 30

4.4. Coeficiente de correlación Regresión lineal en geodesia • Los casos más comunes de regresión se basan en funciones lineales, exponenciales y logarítmicas. En el caso lineal la función tendrá la forma y=mx+b

(j) Lc (j)

L

L

(k)

Siendo L(j) la variable dependiente y L(k) la variable independiente, se llama línea de regresión a la curva ( c ) = L(j) = f ( L(k) ) función de la forma explícita y = f ( x ) que cumple la condición Σ( Lc(j) - L(j) )2 = mínimo con Lc(j) = ordenada medida hasta la curva. Profesor: José Francisco Valverde C

4.5. Histogramas

Ajuste 1 I Ciclo, 2015 31

•Si se considera que X es una variable aleatoria continua, la cual obtiene valores como resultado de un experimento, las n mediciones conforman el vector de observaciones L. •Las n observaciones de la variable se encuentran dentro del intervalo •Los errores aleatorios no se pueden pronosticar, pero pueden deducirse algunas reglas sobre su comportamiento en base a la frecuencia con que se presentan en una serie de mediciones, lo que se puede visualizar en el gráfico conocido como histograma. •La serie de mediciones se divide en distintas clases de un ancho determinado ∆x y se determina la frecuencia con que se da un resultado dentro de cada clase. Con las clases y la frecuencia se construye el histograma Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 32

4.5. Histogramas

b − a) ( ∆x = m

•La cantidad de resultados dentro de cada clase i con el valor central xi, con i = 1 … m, se denomina frecuencia absoluta ki.

0 < ki < n

m

∑k

i

=n

i=1

•La relación entre ki y n se llama frecuencia relativa o función de frecuencia, y se puede utilizar en lugar de la frecuencia absoluta.

ki h( xi , ∆x) = , n

i = 1, 2, ... , n

ki hi = n

0 < hi < 1

m

∑h =1 i =1

i

Profesor: José Francisco Valverde C

4.5. Histogramas

Ajuste 1 I Ciclo, 2015 33

Profesor: José Francisco Valverde C

4.5. Histogramas 35 30 F R E C U E N C IA S ABS O LUTAS

Con la función de frecuencia relativa la suma de las frecuencias era igual a la unidad, y se puede graficad en forma semejante al caso absoluto

HISTOGRAMA

25 20 15 10 5 0 90

100

110

120

130

140

150

INTERVALOS DE CLASE

Con n tendiendo a infinito, la muestra tiende a la población, la función de la frecuencia relativa tiende hacia un límite llamado probabilidad, la función correspondiente se llama función de probabilidad.

ki   P { xi , ∆x} = lim h ( xi , ∆x ) =  n →∞ n 

 P ( xi , ∆x )  f ( x ) = lim   ∆x → dx  ∆x 

Dividiendo la función de probabilidad por ∆x y haciéndolo tender a dx se obtiene Profesor: la función de densidad de probabilidad. José Francisco Valverde C

4.6. Funciones de distribución y de densidad

Ajuste 1 I Ciclo, 2015 35

La distribución normal •Si el tamaño de las mediciones tendiera a infinito y representan en un histograma con intervalos diferenciales (cada vez pequeños) ∆x dx, la curva del histograma tendería a ser una línea continua en forma de campana. •Gauss la llamó curva de error y dedujo su función a partir del cálculo de probabilidades, usando los errores aleatorios en vez de las observaciones en el eje x y las frecuencias en el eje y. •La forma de distribución de los errores aleatorios se llama distribución normal •Si una variable aleatoria siguen una distribución normal se indica:

L ∼ N ( µ ,σ

2

)

Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 36

4.6. Funciones de distribución y de densidad f (ε)

0 4 .

5

0 4 .

0 3 .

5

0 3 .

0 2 .

5

0 2 .

0 1 .

5

0 1 .

ε

0 0 . 5

0 -4

-3

-2

1 f (ε ) = e σ 2π

1 -

ε2 − 2 2σ

0

0

ε: e: s: f(ε):

1

2

3

4

error casual Li – m base de los logaritmos naturales desviación estándar teórica función de densidad probabilidad de la distribución de los errores e

4.6. Funciones de distribución y de densidad

Ajuste 1 I Ciclo, 2015 37

•El comportamiento aleatorio de cada serie se describe por la función de densidad y dependerá de la desviación estándar de cada serie. •En la figura siguiente se muestran tres curvas de distribución normal para valores de desviaciones estándar: menor que la unidad, igual a la unidad y mayor que la unidad. FUNCION DE DENSIDAD PARA DIFERENTES DESVIACIONES ESTÁNDAR TEÓRICAS 0 , 4 5

0 , 4

0 , 3 5

0 , 3

sigma < 1 0 , 2 5

sigma = 1 0 , 2

sigma > 1 0 , 1 5

0 , 1

0 , 0 5

0

- 4

- 3

- 2

- 1

0

1

2

3

4

La distribución normal estándar

Ajuste 1 I Ciclo, 2015 38

•Es una distribución normal que se puede vincular a cualquier distribución normal centrada mediante la siguiente transformación:

ε y= σ

•Los valores de y representan múltiplos de la desviación estándar teórica de la serie de observaciones, la distribución normal general se normaliza en σ. •La distribución normal estándar es una distribución normal con el valor especial σ = 1. • Llevando los valores de y al eje x se obtiene una curva cuya ecuación se denomina función de densidad de la distribución normal estándar. Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 39

Función de densidad de la distribución normal 0.5 0.4 0.3

ϕ ( y)

0.2 0.1 0.0

-4

-3

-2

-1

0

1

1 ϕ ( y) = e 2π

2

3

4

y2 − 2 Profesor: José Francisco Valverde C

La distribución normal estándar

Ajuste 1 I Ciclo, 2015 40

•Si los errores se distribuyen según la distribución normal estándar, entonces se dice que las observaciones siguen una distribución normal estándar o estandarizada:

L ∼ N ( 0,1) •Con la función de densidad de la distribución normal y de la distribución normal estándar se pueden calcular probabilidades. Este cálculo se basa en el área bajo la curva entre los límites -∞ y +∞. •Con este concepto de probabilidad el área total bajo la curva entre esos límites representa el 100% de probabilidad, la unidad, la certeza, ya que la totalidad de los resultados posibles de una serie de mediciones se deben ubicar dentro de los límites. Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 41

Probabilidades para distintos intervalos 0 .2

5

0 .2

0 .1

5

0 .1

0 .0 5

0

3 -

P {−σ < ε < σ } = 68%

P {−σ > ε > σ } = 32%

a 2 -

-σ 1 -

0

0

4 -

σ

1

P {−2σ < ε < 2σ } = 95% P {−2σ > ε > 2σ } = 5%

P {−∞ < ε < ∞} = 100%

b 2

3

4

P {−3σ < ε < 3σ } = 99, 7% P {−3σ > ε > 3σ } = 0,3%

P {a < ε < b} = P Profesor: José Francisco Valverde C

Normalización

Ajuste 1 I Ciclo, 2015 42

•En las computadoras y las calculadoras se tienen integradas las rutinas de la funciones de densidad y de distribución de la distribución normal estándar. •En la gran mayoría de los libros dedicados a la estadística igualmente se tienen tablas con estos valores. •La transformación entre una distribución normal cualquiera y la distribución normal estándar se realiza por medio de la relación conocida como normalización:

ε y= σ

;

y=

(x − µ)

σ

•Los parámetros fundamentales de una distribución normal son el valor más probable µ como valor central y la varianza σ2. Profesor: José Francisco Valverde C

Probabilidad e incertidumbre

Ajuste 1 I Ciclo, 2015 43

•En el estudio estadístico de ciertos eventos es usual establecer un nivel de confianza que equivale a la probabilidad o en su defecto el nivel de incertidumbre. •Entre la probabilidad y el nivel de incertidumbre existe la siguiente relación.

P=1–α •La relación anterior vale cuando se aplica una cola de la distribución. •Si se aplican dos colas simétricas de la distribución, la relación entre probabilidad e incertidumbre está dada por la siguiente igualdad.

P = 1 – 2*α/2 Profesor: José Francisco Valverde C

0 2 .

Ajuste 1 I Ciclo, 2015 44

5

0 2 .

0 1 .

Una cola

5

0 1 .

P 0 0 . 5

α 0

-4

-3

-2

-1

0

1

2

3

4

0 .2

5

0 .2

0 .1

5

0 .1

P

Dos colas α/2

α/2

0 .0 5

0

4 -

3 -

2 -

1 -

0

1

2

3

4

Profesor: José Francisco Valverde C

La distribución t de Student

Ajuste 1 I Ciclo, 2015 45

•Se aplica cuando en la serie de n mediciones de una variable aleatoria se determina la desviación estándar empírica como estimación de la teórica, al normalizar los errores casuales dividiendo por la desviación estándar empírica se obtiene la variable t. t=

ε

s •La variable t no se comporta según la distribución normal, sino que según la distribución t-Student. •La distribución depende de los grados de libertad f y para su determinación deben distinguirse dos casos. •f = n, cuando la desviación estándar s se calcula con errores verdaderos ε. •f = n – 1, cuando la desviación estándar s se calcula con los residuos v. Profesor: José Francisco Valverde C

La distribución t de Student

Ajuste 1 I Ciclo, 2015 46

•La función de densidad (la curva) de la distribución normal estándar es única, pero la de la distribución t varía en función de los grados de libertad. •Cuando n tiende a infinito, la distribución t tiende la distribución normal estándar.

Profesor: José Francisco Valverde C

Ji

Ajuste 1 I Ciclo, 2015 47

La distribución ji-cuadrado

•Dada una cantidad de variables aleatorias que siguen la distribución normal estándar, si se hace la suma de sus cuadrados se obtiene una nueva variable aleatoria cuya distribución se denomina ji-cuadrado

ε n 1 n 2 2 y j = ∼ N ( 0,1) → χ n = ∑ j =1 y = 2 ∑ j =1 ε 2j σ σ χ n2 = n χ =f 2 f

s2

σ

2

s2

σ2

cuando s2 se calcula con errores verdaderos ε. cuando s2 se calcula con los residuos ( f = n – 1 )

Profesor: José Francisco Valverde C

La distribución F o de Fisher

Ajuste 1 I Ciclo, 2015 48

•El cociente de dos parámetros independientes entre si con distribución jicuadrado, define una nueva variable aleatoria F:

χ f2

s

f1

σ

1

Ff1 ,f2 =

χ

2 f2

f2

2 1 2 1 2 2 2 2

2 1 2 2

s = = s s

σ

•La variable F es el cociente de dos varianza empíricas. Su comportamiento se describe 2 σ 2 por medio de la función de densidad de la ⋅ 2 distribución Fisher o distribución F, que σ 1 depende de los grados de libertad f1 y f2 de las respectivas varianzas empíricas

Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza

Ajuste 1 I Ciclo, 2015 49

•Los intervalos de confianza dan el grado de confianza con que se logra una aproximación al valor teórico de una variable aleatoria determinada de forma “empírica”. •El cálculo de los intervalos de confianza se basa en el uso de la estadística matemática, para una determinada probabilidad, que por lo general para el 95% de confianza o 5% de incertidumbre.

P (a ≤ µ ≤ b) = 1− α P ( µ < a) = P ( µ > b) = α / 2 •Elegida la probabilidad o el nivel de incertidumbre, se calculan los valores (a, b) que definen el intervalo de confianza. Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza

Ajuste 1 I Ciclo, 2015 50

1-α = Probabilidad α= incertidumbre µ = valor verdadero

1-α

α/2 a

µ

α/2

b Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza

Ajuste 1 I Ciclo, 2015 51

Intervalo de confianza del valor más probable µ, con σ conocido (distribución normal) •Se parte de una distribución normal y se buscan los límites a y b del intervalo de confianza para µ, asumiendo que se conoce la σ de cada medida, por lo que el error del promedio σx se puede determinar como el cociente de σ entre la raíz cuadrada de n.

σx =

σ n

x − µ) ( y= ∼N

σx

( 0,1)

•Por simetría en la curva de la distribución normal

yα /2 = y1 −α /2

  x − µ) ( P − y α ≤ ≤ y α  = 1−α 1− 1− σ x  2 2  Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza

Ajuste 1 I Ciclo, 2015 52

   x − σ x ⋅ y1− α ≤ µ ≤ x + σ x ⋅ y1− α  = 1 − α  2 2  0 , 2 5

0 , 2

0 , 1 5

1- α 0 , 1

α/2 - 4

α/2

0 , 0 5

- 3

yα/2 - 2

Límites del intervalo de confianza

0

- 1

0 0

1

y1-α/2 2

3

4

a = x − y1−α /2 ⋅ σ x b = x + y1−α /2 ⋅ σ x

Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza

Ajuste 1 I Ciclo, 2015 53

Intervalo de confianza del valor más probable µ, con σ desconocido (distribución t) •Se estima σ a través de la desviación estándar empírica s calculada con los datos de la serie de mediciones, que siguen una distribución t. •La desviación estándar del promedio sx se calcula como el cociente de la desviación estándar empírica de la medición entre la raíz de n.

s sx = n x − µ) ( tf = sx f = n −1

Límites del intervalo de confianza

a = x − f f ,1−α /2 ⋅ sx b = x + t f ,1−α /2 ⋅ sx Profesor: José Francisco Valverde C 53

4.7. Intervalos y regiones de confianza

Ajuste 1 I Ciclo, 2015 54

•Para el caso del test global, se parte del hecho de que se ha hecho un ajuste con f-grados de libertad y que a partir de las n-observaciones se obtiene la varianza a posteriori de la unidad de pesos so2. •El cálculo del intervalo de confianza se hace de la siguiente forma:

a = so

f

χ

2 f ,1−

α 2

b = so

f

χ

2 f,

α 2

•a y b = valores extremos del intervalo de confianza •so = desviación estándar a posteriori de la unidad de pesos •f = grados de libertad •χ2 = cuantil de la distribución Chi-cuadrado Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza

Ajuste 1 I Ciclo, 2015 55

Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza

Ajuste 1 I Ciclo, 2015 56

Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza 2 A1 = λ1 χ 2,1 −α

A2 = λ2 χ w=

2 2,1−α

(σ − σ 2 1

2 2

Ajuste 1 I Ciclo, 2015 57

1 2 2 = σ 1 + σ 22 + w ) χ 2,1 ( −α 2

Calculo de elipses de confianza

1 2 2 2 σ σ χ w = + − ( ) 1 2 2,1−α 2

Las elipses representan una región de confianza, tal que con una probabilidad P = 1 α se puede asegurar estadísticamente que el punto, dado por sus coordenadas teóricas, esta dentro de esa elipse. Entre más pequeña y menos excéntrica es la elipse más confiable es la solución.

)

2

+ 4 σ 122

 2 σ 12  1 Θ = arctan  2 2  2  σ1 − σ 2 

• A1 = semieje mayor de la elipse (a) • A2 = semieje menor de la elipse (b) • Θ = ángulo de giro del semieje mayor

Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza a = σ0

1 2 q + q + w χ ( ) ˆˆ ˆˆ 2,1−α NN EE 2

B = σ0

1 2 q + q − w χ ( ) ˆˆ ˆˆ 2,1−α NN EE 2

w=

( qNNˆ ˆ − qEEˆ ˆ

)

2

2 + 4 qNE ˆˆ

 2 qNE ˆˆ tan 2θ =   qˆ ˆ −qˆˆ EE  NN

  

•a = semieje mayor de la elipse (a) •b = semieje menor de la elipse (b) •θ = ángulo de giro del semieje mayor

Ajuste 1 I Ciclo, 2015 58

Calculo de elipses de confianza Caso teórico Los valores qNN, qEE, qNE se extraen de la matriz de factores y cofactores de las incógnitas ajustadas Qxx Para cada punto son los elementos de la submatriz cuadrada correspondiente a las coordenadas del punto.

Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza a = s0 b = s0 w=

(q (q

ˆˆ NN

+ qEE ˆ ˆ + w ) F2, f ,1−α

ˆˆ NN

+ qEE ˆ ˆ − w ) F2, f ,1−α

( qNNˆ ˆ − qEEˆ ˆ

)

2

2 + 4 qNE ˆˆ

 2 qNE ˆˆ tan 2θ =   qˆ ˆ −qˆˆ EE  NN

  

•a = semieje mayor de la elipse (a) •b = semieje menor de la elipse (b) •θ = ángulo de giro del semieje mayor

Ajuste 1 I Ciclo, 2015 59

Calculo de elipses de confianza Caso empirico Los valores qNN, qEE, qNE se extraen de la matriz de factores y cofactores de las incógnitas ajustadas Qxx Para cada punto son los elementos de la submatriz cuadrada correspondiente a las coordenadas del punto.

Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza

Ajuste 1 I Ciclo, 2015 60

Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza

Ajuste 1 I Ciclo, 2015 61

Profesor: José Francisco Valverde C

4.7. Intervalos y regiones de confianza

Ajuste 1 I Ciclo, 2015 62

Profesor: José Francisco Valverde C

2.8 Test estadísticos

Ajuste 1 I Ciclo, 2015 63

4.8. Test estadísticos

•Es usual en topografía y geodesia tener como resultados dos determinaciones independientes de una misma variable aleatoria, por ejemplo, la distancia entre dos puntos A y B. •Surge la pregunta de que si ambas determinaciones: •Son coincidentes y que la diferencia numérica es natural por la presencia de los errores casuales en las mediciones. •O que discrepan significativamente, eventualmente por un desplazamiento del punto A, del punto B, o de ambos. •La decisión para dar una respuesta o la otra puede tomarse con respaldo en una prueba o test estadístico. •En el ejemplo de la distancia se asume que ambas determinaciones siguen una distribución normal:

(

2 ɶ L1 ∼ N L1 , σ

)

(

2 ɶ L2 ∼ N L2 , σ

)

Profesor: José Francisco Valverde C

Hipótesis

4.8. Test estadísticos

Ajuste 1 I Ciclo, 2015 64

•En teoría, el valor central es el valor verdadero, pero en la práctica lo que se obtiene es el valor ajustado o promediado de la variable aleatoria. •La comparación de ambos resultados conduce al planteamiento de dos hipótesis: una hipótesis nula H0 y una hipótesis alternativa HA1 o HA2.

H 0 : Lˆ1 = Lˆ2 H : Lˆ < Lˆ A1

1

2

H A 2 : Lˆ1 ≠ Lˆ2 •En la hipótesis nula se plantea que ambos resultados son coincidentes; aunque exista diferencia numérica no es significativa y es atribuible a la dispersión natural de los errores en las observaciones. Profesor: José Francisco Valverde C

Ejemplo

4.8. Test estadísticos

Ajuste 1 I Ciclo, 2015 65

•La primera hipótesis alternativa se plantea cuando se espera con cierto fundamento un incremento en el valor de la variable, es decir, un cambio positivo. •La segunda hipótesis alternativa se plantea cuando se asume que pueden haber cambios en los resultados que pueden ser tanto positivos como negativos. •Las hipótesis deben someterse a pruebas o test estadísticos para comprobar su validez. •Para el planteamiento del test debe partirse de que las variables siguen una distribución conocida. •En el ejemplo de la distancia ambas determinaciones siguen una distribución normal, por lo cual su diferencia también seguirá una distribución normal. •Si d es la diferencia entre los dos promedios y σd la desviación Profesor: estándar del promedio: José Francisco Valverde C

Decisión

Ajuste 1 I Ciclo, 2015 66

4.8. Test estadísticos

σ d = σ 12 + sσ 22

d = Lˆ1 − Lˆ2 H0 : y = y: sd:

d

σd

∼ N ( 0,1)

HA : y =

d

σd

∼ N ( yˆ ,1)

estadístico o valor de prueba. desviación estándar de la diferencia, obtenida por medio de propagación de errores

•Bajo la hipótesis nula, y sigue una distribución normal estándar, centrada en el origen y con desviación estándar igual a uno. •Bajo la hipótesis alternativa la distribución es normal pero no estándar, con el valor central igual a la diferencia d estandarizada con la desviación estándar. Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 67

Región de aceptación y rechazo para el estadístico por medio del test de UNA COLA ϕ0(y)

ϕA(y)

REGIÓN DE ACEPTACIÓN

REGIÓN DE RECHAZO

cuantil 1− α

α 0

y1-α

y ≤ y1−α ⇒ H0 : no se rechaza

y

y > y1−α ⇒ H0 : se rechaza Profesor: José Francisco Valverde C

Región de aceptación y rechazo para el estadístico por medio del test de DOBLE COLA ϕ0(y)

ϕA(y)

REGIÓN DE ACEPTACIÓN

REGIÓN DE RECHAZO

Ajuste 1 I Ciclo, 2015 68

REGIÓN DE RECHAZO

cuantil cuantil

α/2 yα/2

y ≤ yα /2 ⇒ H0 : se rechaza

α/2 0

y1-α/2

y

y ≥ y1−α /2 ⇒ H0 : se rechaza

yα /2 ≤ y ≤ y1−α /2 ⇒ H0 : no se rechaza

Profesor: José Francisco Valverde C

Ajuste 1 I Ciclo, 2015 69

4.8. Test estadísticos Pasos generales para la aplicación de un test estadístico

•Formular la hipótesis nula y la hipótesis alternativa. •Calcular del estadístico o valor de prueba a partir de las observaciones que siguen una determinada distribución. •Elegir el nivel de incertidumbre a y determinar los límites entre las regiones de aceptación y rechazo a partir de los valores de distribuciones estadísticas para un test de una cola o de dos colas. •Decidir si la hipótesis nula se acepta o se rechaza, es decir, si el estadístico se encuentra en la zona de aceptación o de rechazo.

Profesor: José Francisco Valverde C

Decisión

Ajuste 1 I Ciclo, 2015 70

4.8. Test estadísticos

4.8.1 Test de significancia para la diferencia de dos promedios, caso con mediciones de la misma varianza •Se hacen una serie de mediciones para las variables aleatorias L1 y L2, que son las componentes de los vectores de observaciones respectivos.

L = [l1 , l2 , l3 ,.....lm ]

L = [l1 , l2 , l3 ,.....ln ]

T 1

T 2

E { L1} =µ1

E { L2 } =µ2

•A través de un test se debe decidirse cuál de las siguientes hipótesis se acepta. Hipótesis nula: Hipótesis alternativas

H0 : HA1: HA2:

µ1 = µ2 µ1 < µ2 µ1 ≠ µ2

Test de 1 cola Test de 2 colas Profesor: José Francisco Valverde C

Decisión

Ajuste 1 I Ciclo, 2015 71

4.8. Test estadísticos 1. Cálculo de los promedios empíricos y la diferencia:

1 T xˆ1 = e L1 m

1 T xˆ2 = e L2 n d = xˆ2 − xˆ1

H0: HA1: HA2:

E{d} = 0 E{d} > 0 E{d} ≠ 0

2. Cálculo de la desviación estándar empírica de la diferencia:

v1 = e ⋅ xˆ1 − Li

i = 1, 2,...., m T v v 2 s1 = m −1

v2 = e ⋅ xˆ2 − Li

i = 1, 2,...., n

T v v 2 s2 = n −1

En este caso la σ2 es la misma para ambos conjuntos, s1 y s2 no son más que estimaciones de la varianza teórica σ2 E{s12 }= E{s22 } = σ2 Profesor: José Francisco Valverde C

Decisión

Ajuste 1 I Ciclo, 2015 72

4.8. Test estadísticos

T T + v v v 2 1 1 2 v2 s = m+n−2

Cálculo de la varianza común a las series de observaciones Por propagación de errores se calcula la desviación estándar de la diferencia d

1 1 sdˆ = s + m n

3. Cálculo del estadístico t que sigue una distribución Student bajo la hipótesis nula, con f = m+n-2, grados de libertad Hipótesis nula

Ho:

t≤q t>q

dˆ t= sdˆ

Ho no se rechaza Ho se rechaza

q: Cuantil de la distribución t, con q = tf,1-α: Test de 1 cola (HA1) q = tf,1-α/2: Test de 2 colas (HA2)

Profesor: José Francisco Valverde C

Decisión

4.8. Test estadísticos

Ajuste 1 I Ciclo, 2015 73

4.8.2 Test de significancia para la diferencia de dos promedios, caso con mediciones de diferente varianza •Se parte de que s12 ≠ s22, la derivación de un test (problema de Behrens-Fisher) es compleja y no existe una solución estricta. •1. Cálculo de las desviaciones estándar empíricas de los promedios, calculados de igual forma que en el caso anterior. 2 1

s s = m 2 xˆ1

2 2

s s = n 2 xˆ 2

•Cálculo de la varianza empírica de la diferencia d

sˆ = s + s 2

d

2 xˆ1

2 xˆ 2 Profesor: José Francisco Valverde C

Decisión

Ajuste 1 I Ciclo, 2015 74

4.8. Test estadísticos

2.

3. Determinación del estadístico o valor de prueba

dˆ t= sdˆ 4. Determinación de los grados de libertad f

f =

1

1− c) ( c + m − a n −1 2

2 xˆ1

2 xˆ1 2

s s c= 2 = 2 sxˆ1 + sxˆ 2 s ˆ d

5. Aplicación del test con base en la distribución de Student de igual forma que en el caso anterior Profesor: José Francisco Valverde C

Decisión

4.8. Test estadísticos

Ajuste 1 I Ciclo, 2015 75

4.8.3 Test de significancia para la varianza, comparación de dos varianzas empíricas •Se presenta cuando se tienen las varianzas empíricas de dos grupos de mediciones y se desea comprobar estadísticamente si corresponden a la misma exactitud o no, aunque difieran numéricamente. s12: s22:

Calculado para el primer grupo con f1 grados de libertad Calculado para el segundo grupo con f2 grados de libertad

•Para el planteamiento del test se asume que la varianza teórica σ2 es igual para ambos casos Hipótesis nula: Hipótesis alternativas

H0:

s 2 = s 12 = s 22 HA1: s12 > s22 Test de 1 cola HA2: s12 ≠ s22 Test de 2 colas

Decisión

4.8. Test estadísticos

Ajuste 1 I Ciclo, 2015 76

•Se calcula el estadístico F tomando como primer grupo y en el numerador el que tiene la mayor varianza. El cociente sigue una distribución de Fisher, con f1 y f2 grados de libertad.

2 1 2 2

s F= s

Cuantiles de la distribución Ff1,f2 : Ff1,f2,1- α (en las tablas) Ff1,f2,α/2 = 1 / Ff1,f2,1- α/2

Decisión en test de una cola: F > Ff1,f2,1 - α H0 se rechaza F ≤ Ff1,f2,1 - α H0 no se rechaza Decisión en test de dos colas: Ff1,f2,α/2 ≤ F ≤ Ff1,f2,1- α/2 H0 no se rechaza F < Ff1,f2,α/2 o F > Ff1,f2,1- α/2 H0 se rechaza

Profesor: José Francisco Valverde C

Decisión

Ajuste 1 I Ciclo, 2015 77

4.8. Test estadísticos

4.8.4 Test de significancia para la varianza, comparación de un grupo de varianzas empíricas •Con m-grupos de mediciones siendo m>2, se calcula la varianza empírica si2 para una sola medición en cada grupo. •Por medio del test se deberá probar si la exactitud en las mediciones refleja su homogeneidad. •El test se desarrolla de la siguiente forma: 1. Suma de los grados de libertad y el promedio pesado de las varianzas. m

f = ∑ fi i =1

m

1 2 s = ∑ f1si f i =1 2

Profesor: José Francisco Valverde C

Decisión

4.8. Test estadísticos

Ajuste 1 I Ciclo, 2015 78

2. Cálculo del factor de escala c para la normalización: m  1 1 1 c = 1+ ⋅ ∑ −  3 ( m − 1)  i =1 fi f 

3. Cálculo del estadístico B, que sigue una distribución χ2 siempre que fi no sea muy pequeño (fi ≥ 10):

1 2 2  B =  f ⋅ ln ( s ) − ∑ fi .ln ( s1 )  c i =1  m

4. Reglas del test: Hipótesis nula

Ho:

B ≤ χ2m-1,1-α Ho no se rechaza B > χ2 m-1,1-α Ho se rechaza Profesor: José Francisco Valverde C