Teoría de la estimación

Teoría de la estimación En las primeras unidades se desarrollaron los conceptos vinculados a la definición de estimadores, sus propiedades deseables,

6 downloads 33 Views 141KB Size

Recommend Stories


LA lmagen DE LA MUJER EN LA POESiA DE JOSEMARTI
LA lMAGEN DE LA MUJER EN LA POESiA DE JOSEMARTI Helena Usandizaga Universitat Autonoma de Barcelona Dos patrias tengo yo: Cuba y la noche. (,0 son un

DOCTRINA DE LA BIBLIA LA DOCTRINA DE LA IGLESIA
DOCTRINA DE LA BIBLIA SEGUNDA EDICIÓN LA DOCTRINA DE LA IGLESIA La doctrina de la iglesia, igual que todas las demás doctrinas de la Biblia, se manif

La Visión de la Epilepsia a Través de la Historia
Bol Clin Hosp Infant Edo Son 2015; 32(2); 87-101 La Visión de la Epilepsia a Través de la Historia. Ana Silvia Figueroa-Duarte* Oscar A. Campbell-Ar

Story Transcript

Teoría de la estimación

En las primeras unidades se desarrollaron los conceptos vinculados a la definición de estimadores, sus propiedades deseables, los métodos para obtener buenos estimadores, y se plantearon los estimadores que gozan de aquellas propiedades y son utilizados en los problemas de aplicación más frecuentes: media muestral, varianza muestral, proporción muestral.

Ahora bien, las estimaciones que se realizan al calcular para cada caso particular el valor surgido de una muestra, no llevan asociadas ninguna idea acerca del grado de aproximación que puede existir entre el valor del estimador y el del parámetro que se está estimando. O dicho de otra forma, no hay una idea acerca del "error" que puede cometerse al afirmar que el parámetro desconocido se "estima" es igual a esa función de las observaciones muestrales definidas por cada estimador.

¿Qué es el "error"' en una estimación? Tal como puede intuirse, se trata de la diferencia existente entre el valor del estimador en una muestra particular (a este valor se le llama estimación) y el verdadero valor del parámetro desconocido. En efecto, si σ es el parámetro que se desea estimar, y θ un estimador de σ, la diferencia en valor absoluto: |σ - θ| 30) extraídas de cualquier población. Entonces por aplicación del teorema central del límite, también x se distribuye N(µ,σ) y el estadístico es N(0,1).

Si la población no es normal, y la muestra es menor que 30 no puede usarse este estadístico (algunas alternativas: realizar alguna transformación con la variable para que la distribución poblacional de la variable transformada se aproxime a la normal.

Varianza poblacional desconocida. Población normal

Si se desconoce la varianza poblacional, el estadístico planteado en (1) no puede aplicarse, ya que existirían dos parámetros desconocidos: µ y σ. Recuérdese que se ha demostrado que el estadístico: _ X–µ

~

t n-1

(2)

S / √n 8 Estadística Aplicada

donde S es la desviación estándar muestral (corregida). Si la muestra es grande, la función de densidad de la t se aproxima a una normal, por lo tanto, los límites de probabilidad pueden ser los correspondientes a la distribución normal ( si n>120). Pero también es importante recordar que para definir la distribución t, necesariamente se parte de una distribución poblacional normal. Luego, si la varianza poblacional es desconocida, pueden construirse intervalos de confianza utilizando el estadístico (2) siempre que la población sea normal. ¿Qué pasa si la población no es normal ? Nuevamente se presentan algunas alternativas: •

Intentar alguna transformación de la variable original para aproximarla a una normal;



Si las muestras son suficientemente grandes (digamos n>100), dado que S es un estimador consistente de σ, puede utilizarse el estadístico (1) utilizando la S muestral en lugar de la σ poblacional, y entonces no seria tampoco necesario que la población fuera normal. (en este caso, por la consistencia de S y luego por el teorema central del límite).



Si la muestra no es mayor que 100 y no puede hacerse una transformación adecuada de la variable para “normalizarla”, deberá recurrirse a la desigualdad de Chebychef.

Intervalos de confianza por Montgomery Una estimación por intervalos de un parámetro desconocido θ es un intervalo de la forma l ≤ θ ≤ u, donde los puntos extremos l y u dependen del valor numérico de la estadística ô para una muestra en particular, y de la distribución de muestreo de Θ. Puesto que muestras diferentes producen valores distintos de ô y, en consecuencia, valores diferentes de los puntos extremos l y u, estos puntos son valores de variables aleatorias, por ejemplo, L y U, respectivamente. De la distribución de muestreo de e es posible determinar los valores de L y U tales que la siguiente proposición de probabilidad es verdadera:

P(L ≤ θ ≤ U) = 1 - α 9 Estadística Aplicada

donde 0 < α < 1. Por tanto, se tiene una probabilidad de 1- α de seleccionar una muestra que produzca un intervalo que contiene el valor verdadero de θ. El intervalo resultante l≤θ≤u se conoce como intervalo de confianza del 100( 1 - α ) por ciento para el parámetro desconocido θ. Las cantidades l y u reciben el nombre de límites de confianza inferior y superior, respectivamente, y 1 - α es el coeficiente de confianza. La interpretación de un intervalo de confianza es que, si se recopila un número infinito de muestras aleatorias y se calcula un intervalo de confianza del 100(1 - α ) por ciento para θ, para cada una de las muestras, entonces el 100( 1 - α ) por ciento de esos intervalos contienen el valor verdadero de θ.

Esta situación se ilustra en la figura siguiente, la cual presenta varios intervalos de confianza del 100( 1-α) por ciento para la media µ de una distribución. Los puntos del centro de cada intervalo indican la estimación puntual de µ (en este caso, x). Nótese que uno de los 15 intervalos no contiene el valor verdadero de µ. Si el intervalo de confianza fuera del 95%, esto significaría que en una corrida larga sólo el 5% de los intervalos no contendrían a µ.

Ahora, en la práctica, se obtiene sólo una muestra aleatoria y se calcula un intervalo de confianza. Puesto que este intervalo puede o no contener el valor verdadero de θ, no es razonable asociar un nivel de probabilidad a este evento específico. La proposición adecuada es que el intervalo observado [l, u] contiene el valor verdadero de θ con una confianza 100( 1 –α ). Esta proposición tiene una interpretación de frecuencia; esto es, no se sabe si es correcta para la muestra en particular, pero el método utilizado para obtener el intervalo [l, u] proporciona proposiciones correctas el 100(1 -α ) por ciento de las veces. El intervalo de confianza de la ecuación anterior recibe el nombre más apropiado de intervalo de confianza bilateral, ya que especifica los límites inferior y superior de θ. En ocasiones, puede resultar más apropiado un intervalo de confianza unilateral. Un intervalo de confianza unilateral inferior del 100(1 -α ) para θ está dado por el intervalo 10 Estadística Aplicada

l≤θ

donde el límite inferior de confianza l se elige de modo que P(L≤ θ ) = 1 - α De manera similar, un intervalo de confianza unilateral superior del 100(1 -α) para θ está dado por el intervalo θ≤u

donde el límite de confianza superior u se escoge de modo que P(θ ≤ U) = 1 - α

La longitud u - l del intervalo de confianza observado es una medida importante de la calidad de la información obtenida de la muestra. El semiintervalo θ-l o u-θ se conoce como precisión del estimador. 11 Estadística Aplicada

Entre más grande sea el intervalo de confianza, mayor es la seguridad de que el intervalo en realidad contenga el valor verdadero de θ. Por otra parte, entre más grande sea el intervalo, menor información se tiene acerca del valor verdadero de θ. En una situación ideal, se tiene un intervalo relativamente pequeño con una confianza grande.

12 Estadística Aplicada

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.