DOS PRUEBAS DE HIPÓTESIS BASADAS EN ESTIMADORES PARA EL PARÁMETRO DE FORMA DE LA DISTRIBUCIÓN WEIBULL TWO TESTS OF HYPOTHESES BASED ON ESTIMATORS FOR THE SHAPE PARAMETER OF THE WEIBULL DISTRIBUTION José A. Villaseñor-Alva1 y Antonio Villanueva-Morales2 1
Especialidad de Postgrado en Estadística. ISEI. Colegio de Postgraduados. 56230, Montecillo, Estado de México. 2División de Estudios Forestales. Universidad Autónoma Chapingo. (
[email protected])
RESUMEN
ABSTRACT
σ,θ θ)=1−exp{−[(x−µ)/σ σ]θ}, La familia de distribuciones Weibull F(x; µ,σ µ, σ>0, θ>0 pertenece a la clase de distribuciones subexponenciax>µ les, de cola derecha pesada, cuando su parámetro de forma θ es menor que 1. El problema de contrastar la hipótesis de cola pesada, θc donde T es un estimador de θ, y c es una constante. Se consideran dos estimadores de θ: el de máxima verosimilitud y uno que es función de las k estadísticas de orden superiores. Se derivan las funciones de potencia aproximadas de las pruebas y se muestra que la prueba basada en el segundo estimador resulta ser consistente respecto al valor de k. Un estudio comparativo en términos de las funciones de potencia indica que en ambos casos se obtienen pruebas uniformemente más potentes que otras pruebas desarrolladas en un estudio previo. Finalmente, el uso de las pruebas propuestas es ilustrado con datos reales y simulados.
σ,θ θ )=1−exp{− [(x−µ)/σ σ ]θ}, x>µ µ, The Weibull distribution F(x; µ,σ σ>0, θ >0 belongs to the class of subexponential distributions with a heavy right tail when the shape parameter θ is less than θ c, where T is an estimator of θ and c is a constant. Two estimators of θ are considered: the maximum likelihood and an estimator which is a function of the k upper order statistics. The approximate power functions of both tests are obtained and the test based on the second estimator is shown to be consistent with respect to the value of k. A comparative study in terms of the power functions indicates that both tests are uniformly more powerful than tests developed in a previous study. Finally, the use of the proposed tests is illustrated through real and simulated data. Key words: Subexponential distributions, power function, tests of hypotheses, simulation.
Palabras clave: Distribución subexponencial, función de potencia, pruebas de hipótesis, simulación.
INTRODUCTION
INTRODUCCIÓN
T
L
a función de distribución Weibull en su forma general de tres parámetros tiene la siguiente expresión:
0
5
J 0
5
F x; µ, σ, θ = 1− exp − x − µ / σ
θ
L
, x > µ, σ > 0, θ > 0
0
he Weibull distribution function, in its general three parameters form, has the following expression:
5
J 0
5
F x; µ, σ, θ = 1− exp − x − µ / σ
θ
L, x > µ, σ > 0, θ > 0 (1)
(1)
where µ, σ and θ are parameters of location, scale, and form, respectively. Model 1 provides a generalization of the exponential distribution of two parameters (θ=1), and the Weibull distribution of two parameters (µ=0). The standard model is obtained by taking µ=0 and σ=1, resulting in the function of standard distribution as:
donde µ, σ y θ son parámetros de localización, escala y forma, respectivamente. El Modelo 1 provee una generalización de la distribución exponencial de dos parámetros Recibido: Mayo, 1998. Aprobado: Junio, 2000. Publicado como ENSAYO en Agrociencia 35: 197-209. 2001.
197
198
AGROCIENCIA VOLUMEN 35, NÚMERO 2, MARZO-ABRIL 2001
(θ=1), y de la distribución Weibull de dos parámetros (µ=0). El modelo estándar se obtiene para µ=0 y σ=1, quedando la función de distribución estándar como:
0
5
2 7
F x;0,1, θ = 1− exp −x θ , x > 0, θ > 0
(2)
En los últimos cincuenta años la distribución Weibull ha ocupado un lugar importante en las áreas de pruebas de vida y confiabilidad. Además, desde 1970 el uso de esta distribución se ha extendido a una amplia diversidad de nuevas aplicaciones (Johnson et al., 1994). Con el uso del modelo se ha incrementado la literatura sobre esta distribución; sin embargo, la mayor parte de ésta se enfoca a la estimación de parámetros y poca a las pruebas de hipótesis. Por ejemplo, un problema importante que no ha recibido la debida atención, es el de evaluar la hipótesis H0:θ x ≈ P Yn > x , cuando x → ∞ (3) i=1
donde Yn es el máximo de la muestra aleatoria X1,..., Xn de una distribución en la clase S. Nótese que la Relación 3 describe una situación donde la suma de los elementos de la muestra es descrita estocásticamente por el máximo muestral cuando x→∞. En relación con el establecimiento de la hipótesis H0:θc, where c is a constant such that the size of the test is α, and α is a specified value that measures the probability of rejecting H0 when it is true. This is called probability of error Type I. From Dubey (1967) we have that θ , which satisfies (7), is asymptotically normal with mean θ and variance θ2/(1.82368 n). Therefore, we have that the approximate power function for the π test given in (8) is:
VILLASEÑOR-ALVA y VILLANUEVA-MORALES: PRUEBAS DE HIPÓTESIS EN LA DISTRIBUCIÓN WEIBULL
α es un valor especificado que mide la probabilidad de rechazar H0 cuando es verdadera, llamada probabilidad del error del Tipo I. De Dubey (1967) se tiene que θ , que satisface (7), es asintóticamente normal con media θ y varianza θ 2/(1.82368 n). Por lo tanto, la función de potencia aproximada para la prueba π en (8) es:
c −1 θ
05
β π θ = P θ > c θ = 1− Φ
182368 . n
#
05
c=
0 5 +1
Φ−1 1− α
. n 182368
Hence, the α-size π test has as its approximate power function:
05
β π θ = 1− Φ
0 5 +1
Φ 01− α5 + 1 −1 ! θ θ −1
1.82368n
0 θ5 =1−Φ Φ 0θ1− α5 + 1θ −1 !
"# #$ (9)
. n 182368
De aquí, la prueba π de tamaño α tiene como función de potencia aproximada:
βπ
05
Thus, because we want the test to be of size α, we require that βπ(1)=α. So the critical constant c for the test of size α is:
Φ−1 1− α
−1
; 0 5@
#
Así, puesto que se quiere que la prueba sea de tamaño α, se requiere que βπ(1)=α. Entonces, la constante crítica c para la prueba de tamaño α es:
c=
sup β π θ = β π 1
sup β π θ = β π 1
θ∈ 0,1
182368 . n
where Φ is the normal standard distribution. It should be remembered that when θ≥1, 1−βπ(θ) is the probability of not rejecting H0 using the π test when H0 is false. It can be observed that βπ is an increasing monotonous function of θ; therefore we have:
θ∈ 0,1
donde Φ es la distribución normal estándar. Recuérdese que cuando θ≥1, 1−βπ(θ) es la probabilidad de no rechazar H0 usando la prueba π cuando H0 es falsa. Puede observarse que βπ es una función monótona creciente en θ, por lo tanto se tiene que:
; 0 5@
c −1 θ
05
β π θ = P θ > c θ = 1− Φ
201
It can be observed that when θ1 and n→∞ then βπ(θ)→1. This
" 1.82368n # #$
1 0.9 0.8
(9) 0.7
UNA PRUEBA BASADA EN EL ESTIMADOR DE MÁXIMA VEROSIMILITUD ASINTÓTICA DE ORDEN k Dada una muestra aleatoria X1,...,Xn de la Distribución 2 y sus correspondientes estadísticas de orden X1:n≥X2:n≥...≥Xk:n≥...≥Xn:n, Klüppelberg y Villaseñor
0.6 βπ (θ)
Puede observarse que cuando θ1 y n→∞ entonces βπ(θ)→1. Esto significa que βπ es consistente. También puede verse que cuando n tiende a ∞, c tiende a uno. En la Figura 1 se muestra la gráfica de (9) para α=0.05 con n=30. Nótese la rapidez de convergencia de βπ al valor 1 conforme θ>1 se incrementa.
0.5 0.4 0.3 0.2 0.1 0.05 0
0
1
2 θ
3
θ) para α=0.05 y n=30. Figura 1. Función de potencia βπ(θ θ) for α=0.05 and n=30. Figure 1. Power function βπ(θ
4
202
AGROCIENCIA VOLUMEN 35, NÚMERO 2, MARZO-ABRIL 2001
(1993) hacen uso de un procedimiento de máxima verosimilitud basado en la teoría asintótica de valores extremos, y derivan un estimador de θ que es función de las k estadísticas de orden superiores X1:n,..., Xk:n. Tal estimador es llamado estimador de máxima verosimilitud asintótica de orden k, abreviado emva[k] y se denota por θ k . De Klüppelberg y Villaseñor (1993) se tiene que el emva[k], k≥2, θ k es la solución de la siguiente ecuación:
3 θ
8 log
−1 k −1
2
n − log θ k = log Vn, k
(10)
donde log2 n = log log n, y:
Vn,k ≡
1 k ∑ Xi:n − X k:n k i=1
(11)
Ahora, defínase a la función h por la ecuación:
3 8 3
Given a random sample X1,...,Xn of Distribution 2 and their corresponding order statistics X1:n≥ X2:n≥ ...≥ Xk:n≥ ...≥ Xn:n, Klüppelberg and Villaseñor (1993) use a maximum likelihood procedure based on the asymptotic theory of extreme values, and derive an estimator of θ which is a function of the k upper order statistics X1:n,..., Xk:n. This estimator is called the k order estimator of maximum asymptotic likelihood, abbreviated emal [k] and is denoted by θ k . From Klüppelberg and Villaseñor (1993) we have that emal [k], k≥2, θ k is the solution to the following equation:
Vn,k ≡
log n 1 =− 22 − < 0, θ k > 0, n > e (12) θ θ k
8 log
−1 k −1
2
n − log θ k = log Vn, k
(10)
where log2 n = log log n, and
Al diferenciar con respecto a θ k se tiene:
3 8
A TEST BASED ON THE k ORDER ESTIMATOR OF ASYMPTOTIC MAXIMUM LIKELIHOOD
3 θ
8
1 log Vn, k = h θ k = θ − k −1 log 2 n − log θ k
h′ θ k
means that βπ is consistent. It can also be seen that if n tends to ∞, then c tends to one. In Figure 1, the graph of (9) for α=0.05 with n=30 is shown. Note the rapid convergence of βπ toward 1 as θ>1 increases.
1 k ∑ Xi:n − X k:n k i=1
(11)
k
Now, define the h function by the equation: Nótese que la derivada en (12) implica que log Vn,k o de manera equivalente, Vn,k es una función monótona decreciente de θ k . Así, una prueba de H0:θc o si h-1(logVn,k)>c, lo cual es equivalente a log Vn,k0, c >0 y n>e, donde e=2.718:
0 5 logθ n +1 > 0, θ > 0 lo cual implica que β 0 θ 5 es una función monótona cre05
1−
t′ θ = 2kc † log n
1 θ
φk
ciente de θ, y por consiguiente:
< 0 5A #
05
sup β φk θ = β φ 1
θ∈ 0,1
Así, si se quiere que la prueba sea de tamaño α, se requiere que β φk 1 = α. Con esto se obtiene que:
05
c† =
05
2
1−
1 θ
c†
It can be easily verified that for k>0, c†>0 and n>e, where e=2.718:
0 5 logθ n +1 > 0, θ > 0 which implies that β 0 θ 5 is an increasing monotonous 05
t′ θ = 2kc † log n
1−
1 θ
2
φk
function of θ and therefore:
05
1 2 −1 χ α 2k 2 k−1#
por lo cual, la prueba φk de tamaño α tiene como función de potencia:
0 5
t θ = 2kθ log n
< 0 5A
05
sup β φk θ = β φ 1
#
θ∈ 0,1
Thus, if we want the test to be of size α, it is necessary that β φk 1 = α. Hence,
05
204
AGROCIENCIA VOLUMEN 35, NÚMERO 2, MARZO-ABRIL 2001
0 5 !
05
β φ k θ = χ 22 k−1# θ log n
1−
1 θ
χ 22 k−1#
−1
0 α5"# (16) $
Se puede ver en (16) que cuando θ1 y n→∞, β φk θ →1. Es decir, φk es una prueba consistente. En la Figura 2 se presentan gráficas de β φk para algunos valores de k con α=0.05 y n=30. Obsérvese que para todo θ>1, β φk θ crece cuando k→n=30. De hecho, al examinar los valores de β φk para todo k≥2 hasta k=n=30 (resultados no mostrados) pudo detectarse que β φ k θ con θ>1 es monótona creciente respecto del valor de k para todo θ>1. Tal comportamiento también fue observado cuando n=20, 40, 50 y 60, (resultados no mostrados). Esto significa que β φk es consistente con k y sugiere que para evaluar H0:θ