Story Transcript
Estadística
Distribuciones de probabilidad
Prof, Dr. Jose Jacobo Zubcoff
Departamento de Ciencias del Mar y Biología Aplicada
Estadística Introducción
Inferencia estadística: Parte de la estadística que estudia grandes colectivos a partir de una pequeña parte de éstos (Población - Muestra) Características de la muestra
• Representativa de la población • Alcanzar objetivos precisión fijados
Tipos de procedimientos: • Inferencia paramétrica: Se admite que la distribución de la pob. pertenece a una familia paramétrica de distribuciones • Inferencia no paramétrica: No supone una distribución de prob. y las hipótesis son más generales (como simetría)
Estadística Introducción Inferencia Estadística
Muestra
Población
x
µ
s
σ
Estadística Introducción
Tipos de variables • Variables cualitativas, categóricas o atributos: No toman valores numéricos y describen cualidades. Ej. Clasificación en base a una cualidad. • Variables cuantitativas discretas: Toman valores enteros, por lo generar contar el nº de veces que ocurre un suceso. • Variables cuantitativas continuas: Toman valores en un intervalo, por lo general medir magnitudes continuas. Variables aleatorias
Estadística Introducción
Variables aleatorias Variable aleatoria: Cualquier función medible que asocia a cada suceso en un experimento aleatorio un número real Variable aleatoria discretas: Una variable aleatoria es discreta si toma valores aislados o puntuales Variable aleatoria continua: Una variable aleatoria es continua si puede tomar cualquier valor dentro de uno o varios intervalos determinados
Estadística Introducción Ejemplo: Estudio de dejar de fumar con parches de nicotina respecto a la edad de dichos pacientes sobre 189 pacientes. 1.00
0.40
0.90
0.35
0.80
0.30 0.70 0.60
fr acum.
fr
0.25
0.20
0.50 0.40
0.15 0.30
0.10 0.20
0.05
0.10 0.00
0.00 30-39 40-49
50-59 60-69
70-79 80-89
Edad
Nº de intervalos entre 4 y 10
0
1
2
3
4
5
Intervalo
r = 1 + 1.33 ln(n) r = 1 + 3.33(log 189) = 8.558 ≈ 9
6
Estadística Introducción
Caracterización: Variables aleatorias discretas (v.a.d.): Función de probabilidad: Asigna a cada posible valor de una variable discreta su probabilidad. Para valores x1, x2, …, xn,… se asocia una p1, p2, …, pn,… donde (n / ∞)
P( X = xi )
y
∑p
i
i =1
=1
Función de distribución: F(x) en un valor x es la probabilidad de que X tome valores menores o iguales a x. Acumula toda la probabilidad entre menos infinito y el punto considerado
F ( x) = P( X ≤ x)
Estadística Introducción
Caracterización: Variables aleatorias continuas (v.a.c.): Función de densidad: Es una función no negativa de integral 1 Función de distribución: Para las v.a.c. queda definida por: x
F ( x) = P( X ≤ x) = ∫ f (u )du −∞
b
P(a < X < b) = P(a ≤ X ≤ b) = ∫ f ( x)dx = F (b) − F (a) a
Estadística Introducción Función de Probabilidad frente a Función de densidad
Función de Distribución
Estadística Introducción
Función esperanza matemática: Variables aleatorias discretas:
E[ X ] = ∑ xi pi i ≥1
Variables aleatorias continuas con función de densidad f: +∞
E[ X ] = ∫ xf ( x)dx −∞
E[X] es el primer momento respecto al origen y por tanto representa la media, esperanza o valor de X
Estadística Introducción
Función Varianza: El momento de orden 2 respecto a la media responde a V[X] y se define como: 1. Discretas:
V [ X ] = µ2 = ∑ ( xi − E[ X ]) 2 pi 2. Continuas: +∞
V [ X ] = µ 2 = ∫ ( x − E[ X ]) 2 f ( x)dx −∞
Estadística
Modelos de distribución discreta
Estadística Proceso de Bernoulli
Ejemplo: Se ha efectuado un experimento sobre avistamientos de cetáceos en un punto determinado. En 200 salidas efectuadas se han anotado 10 avistamientos de cachalote. Describir el experimento: Solución: X = Avistar cachalotes • X=1 (éxito) = 10/200 = 0.05 (5%) • X=0 (fracaso)
q ≈ 1 − p = 0.95
p ≈ 0.05
Estadística Distribución Binomial Resultado de ejecutar n veces un experimento de Bernoulli. Condiciones: • Condiciones no varían • Experimentos independientes (prob. no condicional) Definición del proceso: • X
≡ Nº de éxitos en los n intentos independientes
• Cantidad de veces que se ejecuta (n) • Prob. de éxito (p) • Veces que se obtiene el éxito en las veces que se ejecuta (k)
Estadística Distribución Binomial
Definición: Distribución discreta aplicable a poblaciones con solo dos elementos complementarios (ser o no ser). Condición: Las definidas por las pruebas de Bernoulli: • Solo pueden darse dos resultados • Pruebas independientes entre si • Probabilidades constantes Ejemplos de aplicación: • Situaciones duales día seco/ día húmedo
µ = np
σ 2 = npq
Estadística Distribución Binomial
Expresión: Para p=prob. de éxito y q=1-p=prob. de fracaso
⎧⎛ n ⎞ x n − x ⎪⎜⎜ ⎟⎟ p q P( X = x) = ⎨⎝ x ⎠ ⎪ 0 ⎩
0≤ x≤n ∀otrox
¿Cuándo utilizarla? • Cuando nos dan una determinada cantidad de elementos • Cada elemento puede o no cumplir la condición • Dan o se puede calcular la prob. de que se de la condición • La pregunta es ¿Cuál es la prob. de que determinados elementos cumplan la condición?
Estadística Distribución Binomial
Ejemplo De una población de cetáceos se sabe que el 60% son machos. Si se extrae un conjunto de 10 de ellos, ¿cuál es la probabilidad de que en ese conjunto haya 7 hembras? • X = Nº de hembras en el conjunto • n = 10 • P = 0.4
⎛10 ⎞ 7 10−7 P( X = 7) = ⎜⎜ ⎟⎟0.4 0.6 = 0.042 ⎝ 7 ⎠
¿Cuál es la probabilidad de que hayan 3 o menos hembras?
P( X ≤ 3) = P( X = 0) + P( X = 1) + P( X = 2) + P( X = 3) = 0.382 Tabla Binomial
Estadística Distribución Binomial ¿Cuál es la probabilidad de que en ese conjunto haya 7 machos o menos? PROBLEMA CON LAS TABLAS (p hasta 0.5) • n = 10 • P = 0.6 • P(X3)
P( X ≥ 3) = 1 − P( X ≤ 2) = 0.1673
P( X ≤ 7) = 1 − 0.1673 = 0.8327
Estadística Distribución Binomial
Estadística Distribución de Poisson
Proceso de Poisson Generalización en un soporte continuo del proceso de Bernoulli. Características: • Proceso estable: A largo plazo produce un número medio de sucesos constante por unidad de observación • Aparece aleatoriamente de forma independiente (sin memoria) • X
≡ Nº de éxitos en los n intentos en el soporte continuo
• La función viene caracterizada por el parámetro λ
= E[ X ] = Var[ X ]
Estadística Distribución de Poisson
Definición: La distr. De Poisson con parámetro λ (λ > 0) es la que tiene como función de masa: ⎧ −λ λx ⎪e P( X = x) = ⎨ x! ⎪⎩ 0
x≥0 x 30 p < 0.1 o con np = λ > 30 • Su función de probabilidad puede ajustarse sustituyendo el parámetro de la función por la media. Binomial
np = λ > 1
Poisson
p < 0.1
µ = np σ = npq
A partir de Peña, 2001
npq > 5
Normal
λ >5
µ =λ σ= λ
Estadística Distribución de Poisson
Estadística Distribución de Poisson
Ejemplo Los avistamientos de cachalotes sigue una distribución de Poisson de media 2 avistamientos en un transecto de muestreo de 1km de recorrido tras una salida en barco. Calcula la probabilidad de: 1. Ningún avistamiento en el recorrido del barco: 0 2 P( X = 0) = e −2 = 0.135 0!
2. Menos de cinco en el mismo recorrido: 2 3 4 ⎛ ⎞ 2 2 2 P( X ≤ 4) = e −2 ⎜⎜1 + 2 + + + ⎟⎟ = 0.947 2! 3! 4! ⎠ ⎝
3. Y menos de seis si consideramos un recorrido de 5km
⎛ 10 0 101 10 2 103 10 4 105 ⎞ ⎟⎟ = 0.067 P( X ≤ 5 / λ ) = e ⎜⎜ + + + + + 1! 2! 3! 4! 5! ⎠ ⎝ 0! '
−10
λ' = λ ⋅ 5 = 10
Estadística Distribución de Poisson Y menos de nueve si consideramos un recorrido de 2km
λ' = λ ⋅ 2 = 4 P( X ≤ 8 / λ' ) = 0.018 + 0.073 + 0.147 + 0.195 + 0.195 + 0.156 + 0.104 + 0.06 + 0.03 = 0.978
Utilización de la tabla
Estadística Distribución Binomial
Comando a utilizar con R: • dbinom(x,tamaño,prob): Función de probabilidad • pbinom(x,tamaño,prob): F. prob. acumulada • qbinom(prob,tamaño,prob): Quantiles • rbinom(nobs,tamaño,prob): Números pseudoaleatorios
Estadística Distribución Poisson
Comando a utilizar con R: • dpois(x,lambda): Función de probabilidad • ppois(x,lambda): F. prob. acumulada • qpois(prob,lambda): Quantiles • rpois(nobs,lambda): Números pseudoaleatorios