Story Transcript
3. ANÁLISIS DE DATOS DE PRECIPITACIÓN. Teniendo en cuenta que la mayoría de procesos estadísticos se comportan de forma totalmente aleatoria, es decir, un evento dado no está influenciado por los demás, se puede hacer uso de la estadística como herramienta de análisis de los mismos. Sin embargo, en este documento no se hará una presentación exhaustiva de fundamentos estadísticos, por lo que se sugiere al lector, recordar estos conceptos vistos en los cursos de Probabilidad y estadística. Análisis de frecuencias y determinación del periodo de retorno. Es necesario presentar inicialmente el concepto de periodo de retorno, el cual se define como el número de años que deben transcurrir para que un evento de una magnitud dada sea igualado o superado. Como se trata de igualar o exceder un evento, el periodo de retorno está vinculado a la probabilidad de excedencia, es decir la probabilidad que tiene un evento dado de exceder un valor determinado, de la siguiente forma.
T
1 P( X x)
(1)
Donde T, es el periodo de retorno [años]; P( X x) , es la probabilidad de excedencia. De acuerdo a la teoría de probabilidad tenemos que: P( X x) P( X x) 1
(2)
Con lo que la Ecuación 1 queda:
T
1 1 P( X x)
(3)
Los valores de una serie de datos cuando tienen que ver con mediciones hidrológicas, se denominan series hidrológicas. Para su estudio estadístico, las series hidrológicas se pueden ajustar a una distribución de probabilidad. Una distribución de probabilidad se puede expresar como la probabilidad de ocurrencia de una variable aleatoria, Las distribuciones de probabilidad más comúnmente usadas son la Normal, la Lognormal, la Exponencial, la Gamma y la de Pearson. Para una discusión más profunda acerca de estas, le solicitamos al lector remitirse al módulo de probabilidad y estadística. Las series hidrológicas estudiadas pueden ser de tres tipos:
Series completas. Es una serie compuesta por toda la información disponible. Estas generalmente tienen datos de mediciones diarias durante al menos 15 años.
1
Series parciales. Estas series se componen por aquellos datos que exceden un valor determinado, definido por el investigador. Estas series permiten analizar eventos especiales, por ejemplo, analizar el comportamiento de las lluvias con una intensidad mayor a 50 mm/h.
Series extremas. Este tipo de series está compuesta por los valores máximos o mínimos de la serie, durante el periodo de muestreo, siendo este tomado normalmente igual a 1 año.
Para la evaluación de las series hidrológicas se utilizan básicamente dos formas:
Análisis directo. Este análisis implica el contar con todos los datos para ser analizados en conjunto. Si se posee una gran cantidad de datos, estos se agrupan en intervalos de clase. Si se poseen pocos datos, estos se analizan ordenándolos, generalmente de mayor a menor (en esta forma se determina probabilidad de excedencia). La Probabilidad de excedencia se puede calcular cuando se tienen series de datos usando la Frecuencia relativa, la cual representa el número de éxitos dentro de la población. Cuando se cuenta con un gran número de datos y estos agrupados en intervalos de clase, la Frecuencia de excedencia se calcula como la diferencia entre la Frecuencia de excedencia y la frecuencia relativa. En este caso la primer Frecuencia de excedencia toma el valor de 1 y los demás valores se calculan mediante la diferencia comentada.
Ejemplo. Calcular la Frecuencia relativa, la frecuencia de excedencia y el periodo de retorno en años para los datos de lluvias del mes de Junio, agrupados en los siguientes intervalos de clase.
ORDEN
1 2 3 4 5 6 7 8 9 10 SUMA
INTERVALO FRECUENCIA (mm/día) 0 - 25 25 - 50 50 - 75 75 - 100 100 - 125 125 - 150 150 - 175 175 - 200 200 - 225 225 - 250
294 262 63 28 12 6 3 2 1 1 672
2
La frecuencia relativa se calcula dividiendo el valor de la frecuencia entre el número total de datos. El periodo de retorno se calcula de acuerdo con la Ecuación 1. Lo que debe tenerse en cuenta, es que como los datos son del mes de Junio, para calcular el periodo de retorno en años se divide el valor por 30 días, dado que el año tiene 30 días (cada año tiene 30 días de junio). Los datos se presentan en la siguiente tabla.
INTERVALO FRECUENCIA ORDEN FRECUENCIA (mm/día) RELATIVA 1 2 3 4 5 6 7 8 9 10 SUMA
0 - 25 25 - 50 50 - 75 75 - 100 100 - 125 125 - 150 150 - 175 175 - 200 200 - 225 225 - 250
294 262 63 28 12 6 3 2 1 1 672
0,4375 0,3899 0,0938 0,0417 0,0179 0,0089 0,0045 0,0030 0,0015 0,0015 1,0000
FRECUENCIA DE EXCEDENCIA
PERIODO DE RETORNO (AÑOS)
1 0,5625 0,1726 0,0789 0,0372 0,0193 0,0104 0,0060 0,0030 0,0015
0,0333 0,0593 0,1931 0,4226 0,8960 1,7231 3,2000 5,6000 11,2000 22,4000
Cuando no se cuenta con la serie completa, la probabilidad se puede calcular usando la Frecuencia de excedencia, esta se calcula por medios matemáticos de acuerdo a una distribución que asigna la probabilidad de acuerdo al número de datos y al orden en que se encuentra, estos valores de frecuencia se asignan sobre todo cuando los datos van a ser graficados y por tanto importa su ubicación dentro de la serie de datos. En este caso podemos decir en términos generales que el valor de N, corresponde al número total de datos en la serie. El valor de r, representa el orden que ocupa el valor dentro de la serie, es decir, su posición relativa dentro de la misma. Ver Tabla 1 (Chow, 1994). Tabla 1. Ecuaciones para calcular la probabilidad de excedencia. NOMBRE
AÑO
California
1923
Hazen
1930
Weibull
1939
Chegodayev
1955
ECUACIÓN 1 N 2r 1 2N r N 1 r 0.3 N 0.4
3
3 8 1 N 4 3r 1 3N 1 r 0.44 N 0.12 r
Blom
1958
Tukey
1962
Gringorten
1963
Fuente: Chow (1994 : 406 - 407)
Ejemplo. Calcular la Frecuencia de excedencia y el periodo de retorno en años para los datos de lluvias del mes de Junio, Que se presentan en la siguiente Tabla. Utilizar la ecuación de Weibull para calcular la Frecuencia. Tabla 16. Datos para el cálculo de Frecuencias.
ORDEN 1
2 3 4 5 6 7
8 9 10 11 12 13
14 15
INTENSIDAD (mm/día)
215 208 193 23 45 98 65 78 125 49 178 129 49 21 53
Lo primero que hacemos es ordenar los datos de mayor a menor, esto nos permite calcular la frecuencia de excedencia. Luego usamos la Ecuación de Weibull, para el cálculo de la frecuencia de excedencia y obtenemos el periodo de retorno de acuerdo a la Ecuación 1.
4
ORDEN 1
2 3 4 5 6 7
8 9 10 11 12 13
14 15
INTENSIDAD (mm/día)
215 208 193 178 129 125 98 78 65 53 49 49 45 23 21
FRECUENCIA PERIODO DE DE RETORNO EXCEDENCIA (AÑOS)
0,0625 0,1250 0,1875 0,2500 0,3125 0,3750 0,4375 0,5000 0,5625 0,6250 0,6875 0,7500 0,8125 0,8750 0,9375
16,00 8,00 5,33 4,00 3,20 2,67 2,29 2,00 1,78 1,60 1,45 1,33 1,23 1,14 1,07
Análisis indirecto. Este análisis implica el ajustar los datos a una distribución de probabilidad. En Colombia para el análisis de series hidrológicas se utiliza la distribución de Gumbel, también llamada distribución de valores extremos. Se llama distribución de valores extremos, porque generalmente se analizan los valores máximos o mínimos de la serie, por ejemplo cuando se analizan datos de precipitación o caudales de una fuente hídrica, puede ser interesante tomar los valores máximos de varios años, o por el contrario los mínimos, este análisis es muy común en aplicaciones de Ingeniería donde se deben tener en cuenta las condiciones extremas a la hora de realizar diseños. La distribución de valores extremos presenta tres variaciones, siendo la de tipo I, la más utilizada. Esta fue definida por Gumbel en 1941 y define la probabilidad que presenta un dato en particular de no exceder un valor determinado. Esta distribución presenta la siguiente forma:
P( x)
x x e e 1
(15)
Donde a, es el parámetro de escalamiento y m, el parámetro de localización. Ambos parámetros de la distribución deben ser estimados usando métodos analíticos o bien métodos gráficos.
Método gráfico. Para la determinación de los parámetros por el método gráfico, se sigue la siguiente metodología:
5
1. Obtener la muestra. 2. Ordenar los datos de menor a mayor, para obtener probabilidades de no excedencia. 3. Asignar probabilidad a cada uno de los valores. Para esto, se utiliza la Ecuación de Gringorten, que es la que más se adapta para la distribución de Gumbel. 4. Estimar el valor de la variable estandarizada de Gumbel. 5. Graficar lo datos de la variable estandarizada de Gumbel en el eje X y los de la muestra en el eje Y. 6. Obtener del gráfico los valores de los parámetros.1 Para estimar el valor de la variable estandarizada de Gumbel se procede de la siguiente manera:
P( X x)
x x e e 1
Si tomamos x
x
Podemos definir que:
P( X x)
1
e x e x
Para definir la función de distribución de probabilidad derivamos la Ecuación anterior, lo que nos da:
F ( X ) e e x Aplicando logaritmo natural a ambos lados tenemos:
ln( F ( X )) e x ln( F ( X )) e x Aplicando logaritmo natural nuevamente tenemos: ln( ln( F ( X ))) x x ln( ln( F ( X )))
(16)
x ln( ln( P( X x))) 1
Recordar que en una ecuación de la forma Y=mX+b; m, representa la pendiente de la recta y b, representa el punto de intersección con el eje Y. Remitirse al Módulo de Algebra, Geometría y Trigonometría para una discusión más profunda al respecto.
6
De acuerdo a la Ecuación 14 tenemos que:
T
1 1 P( X x)
T
1 1 F(X )
Despejando F(X), tenemos que: T 1 F(X ) T Reemplazando este valor en la Ecuación 16 tenemos: T 1 x ln( ln T
(17)
Ejemplo 5. Obtener los parámetros de la distribución de Gumbel por el método gráfico, usando los datos del Ejemplo 4 y la Ecuación 17. Tabla 18. Cálculo parámetros distribución de Gumbel. ORDEN 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
INTENSIDAD (mm/día) 21 23 45 49 49 53 65 78 98 125 129 178 193 208 215
P(X