CURSO PROBABILIDAD Y ESTADISTICAS FMS175 PROFESOR RODOLFO TORO DEPARTAMENTO DE FISICA Y MATEMATICAS UNIVERSIDAD NACIONAL ANDRES BELLO

CURSO PROBABILIDAD Y ESTADISTICAS FMS175 PROFESOR RODOLFO TORO DEPARTAMENTO DE FISICA Y MATEMATICAS UNIVERSIDAD NACIONAL ANDRES BELLO EL MÉTODO CI

1 downloads 49 Views 281KB Size

Recommend Stories


UNIVERSIDAD CATOLICA ANDRES BELLO ESTUDIOS DE POSTGRADO
UNIVERSIDAD CATOLICA ANDRES BELLO ESTUDIOS DE POSTGRADO. AREA CIENCIAS ECONOMICAS ESPECIALIZACION EN ECONOMIA EMPRESARIAL TRABAJO DE GRADO DE ESPECIAL

DEPARTAMENTO DE MATEMATICAS DEPARTAMENTO DE MATEMATICAS
DEPARTAMENTO DE MATEMATICAS 1º lección TEMA 1.- LOS NÚMEROS Y LAS OPERACIONES -. Completa la tabla: RECUERDA Millones NUMERO 470.531 Dm Cm MILLAR

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS DEPARTAMENTO DE FISICA FI - 10A INTRODUCCION A LA FISICA LABORATORIO
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS DEPARTAMENTO DE FISICA FI - 10A INTRODUCCION A LA FISICA LABORATORIO Sergio Araven

DEPARTAMENTO DE MATEMATICAS DEPARTAMENTO DE MATEMATICAS
DEPARTAMENTO DE MATEMATICAS 5º lección TEMA 5.- LA DIVISION Recuerda Dividir es repartir en partes iguales. Los términos de la división son: dividen

Story Transcript

CURSO PROBABILIDAD Y ESTADISTICAS FMS175

PROFESOR RODOLFO TORO

DEPARTAMENTO DE FISICA Y MATEMATICAS UNIVERSIDAD NACIONAL ANDRES BELLO

EL MÉTODO CIENTÍFICO La Estadística, constituye así, una disciplina científica extremadamente amplia y que puede ser conceptualizada desde enfoques diferentes e incluso contrapuestos. No es raro, por tanto, que se hayan propugnado para ella distintas definiciones que en el fondo, implican diferentes visiones sobre lo que constituye la característica esencial de esta ciencia como instrumento insustituible para grandes empresarios, asignatura despreciable para muchos estudiantes y una gran desconocida para todos, o casi todos. ESTADÍSTICA Se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Estadística inferencial: Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. Quien utiliza la estadística Campo de la investigación de las Ciencias Sociales: Medicina, Biología, Psicología, Economía, etc. Tipos de variables estadísticas Discretas : Aquellas que toman valores aislados (números naturales), y que no pueden tomar ningún valor intermedio entre dos consecutivos fijados, por ejemplo: número de goles marcados, núm. de hijos, numero de discos comprados, número de pulsaciones. Continuas : Aquellas que toman infinitos valores (números reales) en un intervalo dado, de forma que pueden tomar cualquier valor intermedio, al menos teóricamente, en su rango de variación, por ejemplo: talla, peso, presión sanguínea, temperatura. Tipos de Caracteres El carácter es, por tanto una cualidad o propiedad inherente en el individuo. Cualitativos : aquellos que son categóricos, pero no son numéricos, por ejemplo color de los ojos, profesión, marca de auto. Ordinales : aquellos que pueden ordenarse, pero no son numéricos, por ejemplo: preguntas de encuesta sobre el grado de satisfacción de algo; mucho, poco, nada. Bueno, regular, malo. Cuantitativos : son numéricos. Ejemplo: peso, talla, número de hijos, número de libros leídos al mes.

TIPOS DE GRÁFICOS

Representación de tronco y hoja ejemplo que contiene las calificaciones obtenidas en una prueba de matemáticas: 78 93 61 100 70 83 88 74 97 72 66

73

76

81

Ahora pensaremos en cada uno de los número 51 se verá como 5 | 1. De esta vertical, y las unidades a su derecha: 6 7 8 9 10

83

64

91

70

77

86

datos separando las decenas de las unidades, es decir, el manera las decenas se pondrán en una columna, en forma 1 8 3 3 0

6 0 8 7

4 4 2 3 6 0 7 1 3 6 1

Para entenderle un poco más, hemos de decir que el primer renglón que dice 6 | 1 6 4 quiere decir que entre la lista de datos se encuentran los valores 61, 66 y 64. Esta es la representación gráfica tronco y hoja, donde cada renglón es una posición de tronco y cada dígito de la derecha es una hoja. Para las distribuciones de frecuencias la representación gráfica más común es el histograma.

Un tipo de gráfico muy parecido al histograma es la gráfica de columnas. Es interesante observar que la escala horizontal no es continua (es nominal).

También es posible realizar gráficas de barras horizontales

Gráficas de líneas, que consisten en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con líneas líneas:

Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayor que y las ojivas menor que.

Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por ésto la aplicación de la técnica es parcial): Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el extremo izquierdo; para la ojiva menor que, con el derecho. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor. Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que, utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que está sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se diría: después de las 4:00 horas). De forma análoga, en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el número de observaciones menores que la frontera señalada (en caso de tiempos sería el número de observaciones antes de la hora que señala la frontera). Si se utiliza una distribución porcentual acumulativa entonces se obtiene una ojiva (mayor que o menor que según sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que que se acaba de usar, pero con una distribución porcentual:

Cuando se pretende ilustrar la dispersión de las observaciones realizadas, y así trabajar algunas cosas como correlaciones se puede utilizar una gráfica de dispersión.

Tablas Estadísticas A partir de este momento nos vamos a ocupar de las estadísticas de una sola variable, "Estadísticas Unidimensionales". Las tablas estadísticas según el número de observaciones y según el recorrido de la variable estadística, así tenemos los siguientes tipos de tablas estadísticas: Métodos de Agrupación de Datos Pueden utilizarse varias herramientas básicas para describir y resumir un conjunto grande de datos. La manera más simple, pero quizás la más significativa, es la serie ordenada (13, 23, 35, 47...). Distribución de frecuencias (o tabla de frecuencia) : ordenará los datos si estos se dividen en clases y se registrará el número de observaciones en cada clase. Tabla Unidimensional V ariable X

Frecuen cia ab soluta

xi

ni

x1 x2 x3 . . xp

n1 n2 n3 . . np n

Frecuen cia relativa

fi ó

pi

f1 = n 1 / n f2 = n 2 / n f3 = n 3 / n . . fp = n p / n 1

Frec. o bser. acum u lad a

Frec. relativa acum u lad a

Ni

Fi

N1 = n1 N2 = n1 + n2 N3 = n1 + n2 + n 3 . . Np = n

F 1 = f1 F 2 = f1 + f2 F 3 = f1 + f2 + f 3 . . Fp = 1

In te rv a lo s d e c la s e

M a rc a d e c la s e s

x i-1 - x i

xi

x0 - x1 x 2 -1 - x 2 x 3 -1 - x 3 . . x p -1 - x p

x1 x2 x3 . . xp

Observe que cada clase tiene un límite inferior y un límite superior. Los valores exactos de estos límites son muy importantes. Si los datos en una tabla de frecuencia son continuos, es necesario permitir valores fraccionarios.

El número de clases En una tabla de frecuencia es algo arbitrario, pero demasiadas clases sería algo confuso. Se puede seguir una regla simple para determinar el número de clase a utilizar.

2

c

〉n

La Marca de la clase Se calcula como el promedio de los límites superior e inferior de dicha clase.

Yi =

X

i −1

+ X 2

i

Intervalos de clase : Es el rango de valores encontrados dentro de una clase. Se determina restando el límite superior (o inferior) de una clase del límite inferior (o superior) de la clase siguiente. Es deseable que todos los intervalos de clase sean de igual tamaño, ya que facilita interpretación estadística.

ic = Las frecuencias ni = Frecuencia absoluta ni fi = Frecuencia relativa 0 < fi < 1 fi = n i / N Ni = Frecuencia absoluta acumulada Fi = Frecuencia relativa acumulada

X max − X min N º clases

Nj = Nj-1 + nj Fj = Fj-1 + fj

Ejemplo Ilustrativo Distribución de los alumnos del curso según estatura en cm. 152 - 170 - 178 - 172 - 165 - 182 - 160 187 - 175 - 175 - 173 - 174 - 165 - 158 172 - 177 - 173 - 181 - 172 - 180 n = 20 Determinar número de clases:

Xmín = 152 cm. Xmáx = 187 cm

2 C > 20, despejando C = 4.3 lo que implica aproximar a 5 clases. Determinar el intervalo de clase: ic = 187 - 152 = 7 cm. 5 N.Clase

Intervalo de clase

Marca clase

X i −1 − X i

Y

F.Absoluta F.Absoluta F. F. Relativa Acumulada relativa Acumulada Ni Ni fi Fi

i

1

152 –159

155.5

2

2

0.1

0.1

2

159 – 166

162.5

3

5

0.15

0.25

3

166 – 173

169.5

6

11

0.3

0.55

4

173 – 180

176.5

6

17

0.3

0.85

5

180 - 187

183.5

3

20

0.15

1

Tabulación Bidimensional . Tablas de Contingencia xi : nivel de ingreso i: 1 , 2 , ...., k (fila) j: 1 , 2 , ...., l (columna) yi : tipo de fabrica Yj

YL

n i.

n 11

n 12

........ ........ ........

n 1L

n 1.

x2

n 21

n 22

........ ........ ........

n 2L

n 2. n 3.

n ij

..... .....

........ ........

..... ..... .....

x1

Y3

..... ..... .....

Y2

..... ..... .....

Y1

..... ..... .....

XI

xk

n k1

n k2

........ ........ ........

n kL

nK.

n .j

n .1

n .2

........ ........ ........

n .L

n

nij : Frecuencia absoluta conjunta ni. : Frecuencia absoluta marginal de la variable Xi n.j : Frecuencia absoluta marginal de la variable Yi n : Número total de observaciones, igual a la suma de las frecuencias absolutas conjuntas fij = nij / n : Frecuencia relativa conjunta fi. : Frec. relativa marginal de la variable XI fi. = ni. / n n.j : Frec. relativa marginal de la variable YI f.j = n.j / n k

L

∑∑ i=1

j=1

k

n ij

=

n

;



i=1

L

n i.

=

n

;

∑ n. j=1

j

=

n

Medidas de tendencia Central (posición) y de Dispersión Medida de la tendencia central (media) : ubica e identifica el punto alrededor del cual se centran los datos. Medidas de dispersión : indican el punto hasta el cual las observaciones individuales se esparcen alrededor de su punto central. Miden la dispersión o la variabilidad de los datos y reflejan la tendencia de las observaciones individuales a desviarse de dicho punto central. Características de los datos: medidas de resumen descriptivas Las medidas de resumen descriptivas son útiles para analizar e interpretar datos cuantitativos, ya sean recolectados en forma bruta (datos no agrupados) o resumidos en distribuciones de frecuencia (datos agrupados, que son de interés para el director e investigador). Propiedades de los datos En orden descendente de importancia, las tres propiedades o características mayores que describen un conjunto de datos pertenecientes a alguna variable numérica aleatoria o a un fenómeno de interés, son : 1.- Posición 2.- Dispersión 3.- Forma Si las medidas de resumen descriptivas se calculan con una muestra de datos se llama estadísticos, si estas medidas descriptivas se calculan a partir de toda una población de datos se llama parámetros. MEDIDAS DE POSICIÓN La característica más importante que describe o resume un grupo de datos es su posición. La mayor parte de los conjuntos de datos muestran una tendencia definida a agruparse o reunirse en torno a un cierto punto. Este valor típico descriptivo se llama promedio. Es una medida de tendencia central o posición. Para datos No agrupados La media aritmética muestral : Se calcula a partir de datos, ya sea recopilados en forma bruta o colocados en arreglo ordenado. n

X =

X

n : Xi :



X

i=1

i

n

: Media aritmética de la muestra Tamaño de la muestra iésima observación de la variable aleatoria X

Propiedades n

1.− ∑ (XI − X ) = 0 i =1 n

n

i =1

i= 1

2.− ∑ (XI − X ) 2 ≤ ∑ (XI − A) 2 Donde X ≠ A 3.− Valor total de la poblacion Total = N X 4.- El calculo de la media se basa en cada observacion por esa razon X puede ser influenciado a subir o bajar segun sea el caso.

La media aritmética Poblacional N

µ=

∑X i =1

i

N

La media Ponderada (caso especial de la media aritmética) N

Xw =

∑W X 1

i =1

1

+ ........... + Wn X n

W1 + W2 + ....... + Wn

La media Geométrica

MG = n X 1 * X 2 * ...... * X n La mediana Es una medida de tendencia central que aparece en el “medio” de una sucesión ordenada de valores. Dado que cualquier valor (o valores) extremo en un conjunto de datos distorsionan tanto la media aritmética, es más apropiado utilizar la mediana, ya que no se afecta con cualquiera valores extremos en un conjunto. Para calcular la mediana a partir de un conjunto de datos recopilados en forma bruta, primero hay que disponerlos en un arreglo ordenado. Caso A: Si es impar: 32 42 46 54 46 el valor de la mediana es 46 Caso B: Si es par: 2 8 9 18 21 25 12 13 Existen 2 valores intermedios Mediana = ( 12 + 13) 2 Ubicación de la Mediana Si el número de observaciones en la muestra es un impar, la mediana se representa con el valor numérico de observación ordenada :

Me =

(n + 1) 2

Ejemplo: Numero elementos

1

Valor elemento

25 29

( 6 + 1) = 3.5 2 3.5 ubicación, valor mediana de (30+32)/2 = 31

2

3

4

5

6

30 32 35 35

Si el número de observaciones es par, la mediana se representa con la media o promedio de los dos valores intermedios en el arreglo ordenado. El modo : Es el valor más típico o más común en un conjunto de datos. No es afectado por la ocurrencia de cualquiera valores extremos. Se obtiene con facilidad en un arreglo ordenado. Cuando una observación no es común no hay modo. Es el valor que más se repite. Para datos agrupados La media aritmética N

X=

∑n Y

i i

i =1

n

ni : frecuencia Yi : marca de clase La mediana (Me):

n   2 − N i −1  Me = X i −1 . +   * ic n i    

X

: frontera inferior del intervalo de clase que contiene la mediana ni : número de observaciones en el intervalo de clase que contiene la mediana Ni-1 : número total de observaciones antes del intervalo de clase que contiene la mediana ic : ancho de cada intervalo de clase n / 2 : observación mediana i −1

Como el tamaño de la muestra es N=20, buscamos el intervalo en el que la Frecuencia acumulada es mayor que 20/2=10, que en este caso es el 3º y aplicamos la fórmula anterior. Luego la Mediana será:

 20   2 − 5 Me = 166 +   * 7 = 171,83  6   

Intervalo de clase

F. Absoluta ni

F.Absoluta Acumulada Ni

152 –159

2

2

159 – 166

3

5

166 – 173

6

11

173 – 180

6

17

180 - 187

3

20

X i −1 − X i

Moda (Mo): observación que más se repite de las observaciones

  n i − n i −1 Mo = X i −1 . +   * ic ( n n )( n n ) − − i −1 i +1   i   6−3 Mo = 166 +   * 7 = 166  (6 − 3)(6 − 6) 

Intervalo de clase

F. Absoluta ni

F.Absoluta Acumulada Ni

152 –159

2

2

159 – 166

3

5

166 – 173

6

11

173 – 180

6

17

180 - 187

3

20

X i −1 − X i

Simetrías de distribución Asimetrías X > Mediana :Positivo o sesgamiento a la derecha (moda

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.