Story Transcript
´ BOLIVAR ´ UNIVERSIDAD SIMON DECANATO DE ESTUDIOS DE POSTGRADO ´ DE POSTGRADO EN ESTAD´ISTICA COORDINACION MAESTR´IA EN ESTAD´ISTICA
TRABAJO DE GRADO
MODELAJE BAYESIANO ESPACIO-TEMPORAL DE LA INCIDENCIA DE MALARIA EN EL ESTADO SUCRE-VENEZUELA
por Desire´e Egle´e Villalta
Septiembre, 2009
´ BOLIVAR ´ UNIVERSIDAD SIMON DECANATO DE ESTUDIOS DE POSTGRADO ´ DE POSTGRADO EN ESTAD´ISTICA COORDINACION MAESTR´IA EN ESTAD´ISTICA
MODELAJE BAYESIANO ESPACIO-TEMPORAL DE LA INCIDENCIA DE MALARIA EN EL ESTADO SUCRE-VENEZUELA
Trabajo de Grado presentado a la Universidad Sim´on Bol´ıvar por Desire´e Egle´e Villalta
como requisito parcial para optar al grado de acad´emico de Magister en Estad´ıstica. Con la asesor´ıa de la profesora Dra. Lelys Bravo.
Septiembre, 2009
ii
DEDICATORIA A mi madre por su apoyo, comprensi´on y est´ımulo en todo momento.
A todas aquellas personas que este trabajo de alguna forma les ayude en su aprendizaje.
iii
AGRADECIMIENTOS Una vez le´ı en un trabajo que una de las principales satisfacciones que produce terminar un trabajo de tesis es tener la oportunidad de llenar unas l´ıneas dedicadas a los seres queridos y seguramente esta secci´on es la menos relevante desde el punto de vista cient´ıfico, pero sin lugar a dudas la m´as importante desde la perspectiva personal y para muchos la parte que leer´an con mayor atenci´on. Gran comentario con el que quise comenzar estas l´ıneas.
Quiero agradecer a Dios por estar en cada momento y a mis padres apoyarme a lo largo de estos a˜nos.
En el a´ mbito acad´emico a la profesora Lelys Bravo de Guenni por el est´ımulo, apoyo y paciencia, tanto en las buenas como en las malas. Este gesto se lo agradezco de coraz´on. Adem´as, por hacerme entender que mas all´a de nuestro pa´ıs hay un mundo que hay que comerselo!.
Al profesor Lucas Fern´andez Reyes por permitirme participar en el programa Iberoamericano de Ciencia y Tecnolog´ıa para el Desarrollo, CYTED y la Agencia Espa˜nola de Cooperaci´on Internacional para el Desarrollo, AECID el cual se desarroll´o en Bolivia; a las XXI Jornadas Venezolanas Matem´aticas que se celebraron en Barquisimeto-Venezuela y al profesor Rafael Lairet por participar en el III Ciclo de Conferencias sobre Cambios Ambientales Globales y II segundo curso Internacional sobre el Cambio Clim´atico Global y la Salud en el siglo XXI que se celebr´o en Caracas, por permitir realizar las presentaciones de adelanto del trabajo de tesis. Tambi´en a la XXI iv
v Escuela Venezolana de Matem´aticas, Emalca 2008 por proporcionar un ejemplo mi trabajo en el libro “An´alisis de Datos con T´ecnicas Bayesianas”.
A la Universidad Sim´on Bol´ıvar, en especial al Centro de Estad´ıstica y Software Matem´atico (CESMa) y al proyecto “Desarrollo de un Repositorio de datos hidro-clim´aticos para la gesti´on de riesgos epidemiol´ogicos y ambientales”por participar en este ambicioso proyecto.
A la profesora Isabel Llatas por su apoyo y comentarios en este trabajo; a las profesoras Yasmin Rubio por su valioso aporte en los datos de casos de malaria y al Instituto de Zoolog´ıa Tropical de la Universidad Central de Venezuela, en particular a la profesora Laura Delgado por su aporte de datos y por su tiempo.
A Hugo Villarroel por su ayuda incondicional como siempre en LATEXy a Ra´ul Ram´ırez por su apoyo y disposici´on de ayudarme en todo momento para la realizaci´on de los mapas de este trabajo.
Con mucho cari˜no a Otilio Rojas, Annkar’ys G´omez, Katiuska Alvarado, Crishen Acosta, Jhan Rodr´ıguez, Pedro Sequera y Mauricio Estacio por estar pendiente en todo momento de los mosquitos!.
Y finalmente a todo(a)s aquello(a)s que despu´es de preguntarme tantas veces ¿cu´ando terminas? o´ ¿te falta mucho? ahora s´ı les puedo contestar que por fin he terminado.
vi
´ BOLIVAR ´ UNIVERSIDAD SIMON DECANATO DE ESTUDIOS DE POSTGRADO ´ DE POSTGRADO EN ESTAD´ISTICA COORDINACION MAESTR´IA EN ESTAD´ISTICA MODELAJE BAYESIANO ESPACIO-TEMPORAL DE LA INCIDENCIA DE MALARIA EN EL ESTADO SUCRE-VENEZUELA Por: Villalta Desire´e Egle´e Carnet No. 0584982 Tutora:Lelys Bravo Septiembre 2009
RESUMEN En el presente trabajo se presenta un modelo areal Bayesiano jer´arquico de regresi´on logPoisson espacio-temporal para modelar la incidencia de la malaria en el Estado Sucre-Venezuela, durante el per´ıodo 1990 − 2002 en los 15 municipios del estado. Mediante la implementaci´on de c´odigos en el software WinBUGS, se selecciona un modelo que incluye covariables clim´aticas y socio-econ´omicas, donde el efecto CAR est´a presente. Para el proceso de selecci´on de modelos se utiliza el criterio de la M´ınima P´erdida Predictiva a Posteriori (D). Se prueba la independencia de los residuales del modelo resultante utilizando el estad´ıstico I de Mor´an; se verifica el ajuste del modelo mediante el p-bayesiano, concluy´endose que las covariables de agricultura, m´aximo de precipitaci´on y pobreza influyen en la propagaci´on del mosquito para los a˜nos de estudio. Se presenta un caso especial para el a˜no 1997 donde se ajusta el modelo mediante una distribuci´on de colas pesadas. PALABRAS CLAVES: Malaria, estado Sucre, modelos bayesianos jer´arquicos, regresi´on logPoisson, modelos areales.
´ INDICE GENERAL DEDICATORIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iii
AGRADECIMIENTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iv
RESUMEN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
vi
´INDICE DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ix
´INDICE DE TABLAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii I
´ INTRODUCCION
1
I.1
Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
I.1.1
Regi´on de Estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
I.2
Justificaci´on e Importancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
I.3
Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
I.4
Objetivos Espec´ıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
I.4.1
10
Estructura del Trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . .
´ II MARCO TEORICO
12
II.0.2
Conceptos Bayesianos B´asicos y Teorema de Bayes . . . . . . . . . . . .
12
II.1 Datos Areales y Modelaje de Enfermedades . . . . . . . . . . . . . . . . . . . . .
14
II.1.1
Tasa de Incidencia Estandarizada . . . . . . . . . . . . . . . . . . . . . .
14
II.2 Modelos que Mejoran el Estimador (TIE) . . . . . . . . . . . . . . . . . . . . . .
17
II.3 Modelo Espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
II.3.1
Modelo Poisson-Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
17
´ INDICE GENERAL II.3.2
viii
Modelo Log-Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
II.4 Modelo Condicional Auto Regresivo (CAR) . . . . . . . . . . . . . . . . . . . . .
21
II.5 Modelo Espacio-Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
II.5.1
Distribuciones Condicionales a Posteriori . . . . . . . . . . . . . . . . . .
24
II.6 M´etodos Monte Carlo de Cadenas de Markov (MCMC) . . . . . . . . . . . . . . .
28
II.6.1
Muestreador de Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
II.6.2
El Algoritmo de Metr´opolis-Hasting . . . . . . . . . . . . . . . . . . . . .
30
II.6.3
Generalizaci´on del Algoritmo de Metr´opolis- Hastings . . . . . . . . . . .
32
II.7 Criterios Empleados para Escoger el Mejor Modelo Jer´arquico Areal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
II.7.1
Criterio de Informaci´on de Devianza (DIC) . . . . . . . . . . . . . . . . .
32
II.7.2
Criterio de M´ınima P´erdida Predictiva (D) . . . . . . . . . . . . . . . . . .
34
II.8 Estudio de los Residuos del Modelo . . . . . . . . . . . . . . . . . . . . . . . . .
36
II.9 P-valor Bayesiano Predictivo a Posteriori . . . . . . . . . . . . . . . . . . . . . .
39
´ DE LA BASE DE DATOS III CONSTRUCCION
41
III.1 Obtenci´on de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
III.2 Procesamiento y Depuraci´on de los Datos . . . . . . . . . . . . . . . . . . . . . .
42
III.2.1 Datos de Malaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
III.2.2 Variables Sociales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
III.2.3 Variables Clim´aticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
III.2.4 Casos de Malaria Importados . . . . . . . . . . . . . . . . . . . . . . . . .
58
IV RESULTADOS
60
IV.1 Variables Explicativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
IV.2 Comparaci´on de los Modelos Ajustados . . . . . . . . . . . . . . . . . . . . . . .
61
IV.3 Modelo Elegido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
IV.4 Comportamiento de los Residuos . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
´ INDICE GENERAL
ix
IV.5 Verificaci´on del Modelo Escogido . . . . . . . . . . . . . . . . . . . . . . . . . .
70
IV.5.1 Caso Especial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
IV.6 Tablas Comparativas por Municipio . . . . . . . . . . . . . . . . . . . . . . . . .
86
IV.7 Distribuciones a Posteriori de los Par´ametros del Modelo IV.3.1 . . . . . . . . . . 101 V CONCLUSIONES Y RECOMENDACIONES
107
REFERENCIAS
110
A Variables Clim´aticas
116
A.1 M´etodo de Interpolaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 A.1.1 Modelo B´asico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 A.1.2 Manejo de Datos Faltantes . . . . . . . . . . . . . . . . . . . . . . . . . . 119 A.1.3 Agrupamiento de Estaciones Seg´un el R´egimen de Lluvia . . . . . . . . . 120 A.1.4 Completaci´on de Datos Faltantes en Varias Estaciones . . . . . . . . . . . 120 A.1.5 M´etodo de Imputaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 A.1.6 Algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 B C´odigos en WinBugs
124
B.0.7
C´odigo del Modelo IV.3.1 . . . . . . . . . . . . . . . . . . . . . . . . . . 124
B.0.8
C´odigo del Modelo IV.5.1 . . . . . . . . . . . . . . . . . . . . . . . . . . 137
´ INDICE DE FIGURAS I.1
I.2
Mapa mundial que muestra las regiones mal´aricas. Figura de elaboraci´on propia. Fuente: http://www.anlis.gov.ar/consulta/infecciosas/malaria/malaria.htm . . . . .
2
Distribuci´on de los 15 municipios en el estado Sucre. . . . . . . . . . . . . . . . .
7
II.1 Mapas de riesgos relativos observados en los 15 municipios del estado Sucre durante los a˜nos 1990 − 2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
II.2 Dos niveles de jerarqu´ıa para el modelo Poisson-Gamma . . . . . . . . . . . . . .
19
II.3 Residuos del modelo escogido en el a˜no 1998 . . . . . . . . . . . . . . . . . . . .
37
III.1 N´umero de casos de malaria en los 15 municipios del estado Sucre en el per´ıodo 1990 − 2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
III.2 Boxplot de las variables de necesidades b´asicas en los a˜nos 1990 y 2001 para los 15 municipios del estado Sucre. . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
III.3 Biplot de variables de necesidades b´asicas para los 15 municipios del estado Sucre en el a˜no 1990 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
III.4 Dendograma para los 15 municipios del estado Sucre basadosen las variables de necesidades b´asicas para el a˜no 1990 . . . . . . . . . . . . . . . . . . . . . . . . .
48
III.5 Biplot de las variables de necesidades b´asicas para el a˜no 2001 en los 15 municipios del estado Sucre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
III.6 Dendograma de los municipios usando variables de necesidades b´asicas para el a˜no 2001 en los 15 municipios del estado Sucre . . . . . . . . . . . . . . . . . . . . . x
50
´ INDICE DE FIGURAS
xi
III.7 Biplot de las variables de tipo de empleos para los 15 municipios del estado Sucre en el a˜no 1999. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
52
III.8 Dendograma de los municipios usando variables de empleo en el a˜no 1999 para los 15 municipios del estado Sucre. . . . . . . . . . . . . . . . . . . . . . . . . . . .
54
III.9 Biplot de las variables de servicios para los 15 municipios del estado Sucre en el a˜no 1995 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
III.10Dendograma de los municipios de las variables de servicios en el a˜no 1995, para los 15 municipios del estado Sucre . . . . . . . . . . . . . . . . . . . . . . . . . .
56
III.11Distribuci´on de las 23 estaciones climatol´ogicas en el estado Sucre. . . . . . . . .
57
III.12Casos importados de malaria al estado Sucre para 1989-1999 . . . . . . . . . . . .
58
IV.1 Doodle del modelo escogido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
IV.2 Cadenas de convergencia de los par´ametros β1 , β2 , β5 , β9 para algunos a˜nos de estudio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
IV.3 Mediana del componente CAR para cada municipio del estado Sucre en los a˜nos 1990 − 2002. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
IV.4 Residuos estimados para el modelo seleccionado . . . . . . . . . . . . . . . . . .
69
IV.5 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1990 y p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
IV.6 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1991 y p-valor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
IV.7 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1992 y p-valor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
74
IV.8 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1993 y p-valor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75
IV.9 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1994 y p-valor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
´ INDICE DE FIGURAS
xii
IV.10 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1995 y p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
IV.11 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1996 y p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
78
IV.12 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1997 y p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
79
IV.13 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1997 con distribuciones de colas pesadas para el par´ametro v . . . . . . . . . . . .
81
IV.14 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1998 y p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
82
IV.15 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1999 y p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
IV.16 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 2000 y p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
84
IV.17 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 2001 y p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
IV.18 Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 2002 y p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
86
IV.19 Distribuciones a posteriori del coeficiente α para los a˜nos de estudio del modelo IV.3.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 IV.20 Distribuciones a posteriori del coeficiente β1 para los a˜nos de estudio del modelo IV.3.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 IV.21 Distribuciones a posteriori del coeficiente β2 para los a˜nos de estudio del modelo IV.3.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 IV.22 Distribuciones a posteriori del coeficiente β5 para los a˜nos de estudio del modelo IV.3.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
´ INDICE DE FIGURAS
xiii
IV.23 Distribuciones a posteriori del coeficiente β9 para los a˜nos de estudio el modelo IV.3.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 A.1 Patr´on de datos faltantes en forma de escalera. . . . . . . . . . . . . . . . . . . . . 119
´ INDICE DE TABLAS IV.1 Comparaci´on del ajuste de los modelos sencillos (sin CAR) y complejos (con CAR) con los criterios de DIC y D . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
IV.2 Estad´ıstico I de Mor´an e intervalo de probabilidad calculado por a˜no para el estado Sucre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
70
IV.3 Identificaci´on de Municipios respecto a las Figuras IV.5-IV.18 . . . . . . . . . . .
71
IV.4 Intervalo de probabilidad y riesgo relativo para el municipio Andr´es Eloy Blanco en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
IV.5 Intervalo de probabilidad y riesgo relativo para el municipio Andr´es Mata en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
88
IV.6 Intervalo de probabilidad y riesgo relativo para el municipio Arismendi en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
IV.7 Intervalo de probabilidad y riesgo relativo para el municipio Ben´ıtez en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
90
IV.8 Intervalo de probabilidad y riesgo relativo para el municipio Berm´udez en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
91
IV.9 Intervalo de probabilidad y riesgo relativo para el municipio Bol´ıvar en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
92
IV.10 Intervalo de probabilidad y riesgo relativo para el municipio Cajigal en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xiv
93
´ INDICE DE TABLAS
xv
IV.11 Intervalo de probabilidad y riesgo relativo para el municipio Cruz Salmer´on Acosta en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
94
IV.12 Intervalo de probabilidad y riesgo relativo para el municipio Libertador en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
IV.13 Intervalo de probabilidad y riesgo relativo para el municipio Mari˜no en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
96
IV.14 Intervalo de probabilidad y riesgo relativo para el municipio Mej´ıa en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
97
IV.15 Intervalo de probabilidad y riesgo relativo para el municipio Montes en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
IV.16 Intervalo de probabilidad y riesgo relativo para el municipio Ribero en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
IV.17 Intervalo de probabilidad y riesgo relativo para el municipio Sucre en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 IV.18 Intervalo de probabilidad y riesgo relativo para el municipio Vald´ez en el per´ıodo 1990-2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
´ CAPITULO I ´ INTRODUCCION La malaria o paludismo es una enfermedad end´emica cuya transmisi´on ocurre principalmente en regiones tropicales y subtropicales [38] como se observa en la Figura I.1. Esta enfermedad a´un sigue siendo un problema grave para la poblaci´on del planeta, expuesta todav´ıa a los riesgos de e´ sta en´ fermedad. Ademas, es considerada una de las patolog´ıas m´as importante de los seres humanos; end´emica (concentrada localmente) en grandes extensiones de Am´erica Central y Sudam´erica, ´ Santo Domingo (Hait´ı y Rep´ublica Dominicana), Africa, el subcontinente indio, el sudeste asi´atico, el Oriente Medio y Ocean´ıa [24]; para el 2006 el paludismo estuvo presente en 109 pa´ıses y territorios. Seg´un estimaciones de la OMS/PAHO (Organizaci´on Mundial de la Salud), todos los a˜nos entre 300 y 500 millones de personas contraen la infecci´on y m´as de 1 mill´on de muertes son atribuidas a esta enfermedad [24].
1
´ ´ CAPITULO I. INTRODUCCION
2
Regiones con malaria Regiones sin malaria
5.000 Km
Figura I.1: Mapa mundial que muestra las regiones mal´aricas. Figura de elaboraci´on propia. Fuente: http://www.anlis.gov.ar/consulta/infecciosas/malaria/malaria.htm La malaria es transmitida por un mosquito hembra del g´enero Anopheles, la cual pica al individuo infectado. El ciclo de transmisi´on de la malaria comienza cuando e´ ste succiona sangre que contiene par´asitos de malaria y llegan hasta sus gl´andulas salivares. Al mosquito picar a otra persona, inyecta par´asitos junto con su saliva. Una vez dentro de la persona, los par´asitos se depositan en el h´ıgado, donde se multiplican. Maduran en el curso de dos a cuatro semanas y luego abandonan el h´ıgado e invaden los gl´obulos rojos. Los par´asitos se multiplican dentro de los gl´obulos rojos, lo que finalmente hace que e´ stos se rompan.Tambi´en se pueden presentar casos en que la enfermedad se transmita por tranfusi´on de sangre (agujas infectadas).
Existen m´as de 150 especies de par´asitos protozoarios amiboideos del g´enero Plasmodium, pero s´olo cuatro que infectan al hombre y que se presentan con mayor frecuencia en el cintur´on mal´arico, e´ stos son:
• Pasmodium falciparum, agente causante de fiebre terciana o maligna. • Pasmodium malariae, agente etiol´ogico de la fiebre cuartana. Se encuentra ampliamente distribuido en el mundo pero es mucho menos frecuente.
´ ´ CAPITULO I. INTRODUCCION
3
• Pasmodium ovale, que determina la fiebre terciana. Es raro, pero en el oeste de Africa parece que reemplaza a P. vivax y no se encuentra en Am´erica. • Pasmodium vivax, agente productor de la fiebre terciana benigna. Este tipo de malaria es el predominante en el estado Sucre. Las crisis sociales, migraciones descontroladas, las agresiones al medio ambiente, as´ı como los sistemas sanitarios ineficaces, comunidades sin recursos, falta de conciencia en la poblaci´on y de entes gubernamentales que se avoquen a la problem´atica son algunos factores que favorecen la propagaci´on de la enfermedad.
En la literatura se ha observado que diversas variables influyen en la propagaci´on del mosquito, como por ejemplo variables socio-econ´omicas, clim´aticas, migraciones desde y hacia zonas mal´aricas, la influencia del individuo como elemento modificador del paisaje entre otras.
Como es mencionado en [13], las enfermedades transmitidas por vectores son sistemas altamente complejos y din´amicos en tiempo y espacio, es por ello que se propone ajustar un modelo bayesiano jer´arquico espacio temporal que modele la incidencia de la malaria en el estado Sucre en el per´ıodo 1990 − 2002, donde se espera determinar cuales variables influyen en la propagaci´on del vector y medir el riesgo de la adquisici´on de la enfermedad; adem´as de contar con un sistema de informaci´on geogr´afico (SIG) que nos permita visualizar las regiones afectadas por la enfermedad en el estado Sucre.
La ocurrencia de esta enfermedad en el estado Sucre es alarmante por la cantidad de casos que se presentaron en los u´ ltimos a˜nos de estudio. Esto es reflejado en art´ıculos como [2, 8, 11, 10, 35, 13] donde concluyen que en diversos municipios de este estado presentan grandes problemas en cuanto a la erradicaci´on de la enfermedad y los casos est´an en aumento por ser un estado pobre en relaci´on con el resto de los estados de Venezuela. Adem´as de otras caracter´ısticas del estado como la diversidad de la vegetaci´on, la agricultura y criaderos de mosquitos, entre otros.
´ ´ CAPITULO I. INTRODUCCION
4
I.1 Antecedentes La malaria contin´ua siendo el mayor problema de salud p´ublica en el a´ mbito mundial y su control se complica cada d´ıa por el incremento en la resistencia del par´asito a los antimal´aricos y de los vectores a los insecticidas, as´ı como al progresivo aumento en el n´umero de focos mal´aricos debido al crecimiento y migraci´on de la poblaci´on, las transformaciones ambientales [2], desplazamientos humanos, actividad minera no controlada, los sistemas sanitarios ineficaces, las comunidades sin recursos [11], cambios en el patr´on de usos de la tierra y calentamiento global, entre otros.
Como lo citan [45, 54] la Organizaci´on Mundial de la Salud, ha estimado que aproximadamente 200 millones de personas (36% del total de la poblaci´on de las Am´ericas) vive en a´ reas end´emicas. Entre la poblaci´on que vive en estos 21 pa´ıses, 56% vive en a´ reas con bajo nivel de transmisi´on, 24% vive en moderado riesgo y el 20% en un nivel alto de transmisi´on de la enfermedad.
Mucho se ha especulado sobre el origen de la malaria en Am´erica. Algunos autores postulan que Plasmodium vivax, fue introducida por poblaciones asi´aticas cuando migraron hacia Am´erica en la e´ poca precolombina por el estrecho de Behring [48].
En el caso de Plasmodium falciparum, existe consenso en la introducci´on de esta especie, a ´ trav´es del tr´afico de esclavos desde el Africa ecuatorial occidental a partir del siglo XVI [48]. En relaci´on a P. malariae, existe la controversia si esta especie corresponde a P. brasilianum, una especie de malaria de primates americanos, y por lo tanto, e´ sta podr´ıa ser la u´ nica especie aut´octona, de no haber sido introducida como ocurri´o con P. falciparum.
A partir del siglo XVI, la malaria se extendi´o desde los estados sure˜nos de los Estados Unidos hasta el norte de Argentina, incluidas algunas islas del Caribe.
La estructuraci´on de programas verticales de control de malaria en las distintas rep´ublicas
´ ´ CAPITULO I. INTRODUCCION
5
latinoamericanas fueron exitosas hasta comienzos de la d´ecada de los 70. Particularmente, en Venezuela luego de la introducci´on del DDT en 1945, se logr´o disminuir las altas tasas de mortalidad de m´as de 200 muertes por 100.000 hab, antes de 1936, a menos de 0, 2. Sin embargo, notables e´ xitos se hab´ıan ya logrado antes de la aplicaci´on del DDT con tratamientos masivos con quinina, obras de ingenier´ıa sanitaria y el uso de insecticidas de corta duraci´on [17].
Como lo referencian diversos autores, la malaria en Venezuela se concentra en los estados Bol´ıvar, Amazonas, Sucre, Delta Amacuro y Zulia, teniendo estos estados diversos grados de endemicidad y distribuciones de Plasmodium [45].
Sucre es el segundo estado con mayor cantidad de casos de paludismo en nuestro pa´ıs, siendo el principal vector Anopheles aquasalis Curry tanto en el estado como en la regi´on nor-oriental del pa´ıs [35], en el cual predomina el par´asito Plasmodium vivax que puede causar infecciones debilitantes pero raras veces mortales.
La malaria se consider´o erradicada del estado Sucre en 1965, logro que se bas´o en el control qu´ımico del vector y en la quimioterapia. Sin embargo, en 1983 la enfermedad reapareci´o en el estado y ha persistido, pese a los esfuerzos realizados para su control [9]. La enfermedad repunt´o en los a˜nos 2000 y 2002, principalmente en los municipios Mari˜no, Cajigal, Ben´ıtez, Andr´es Eloy Blanco, Ribero y Libertador donde se realiz´o la campa˜na Cura Radical Masiva (CRM) para disminuir el brote de paludismo, obteni´endose una reducci´on de casos de 69, 65% [9, 11].
Los casos importados de malaria es otro de los problemas que se presenta a la hora de contabilizar la poblaci´on enferma. Estos casos son definidos por [45] como cualquier caso infectado fuera de un a´ rea definida en la cual el diagn´ostico se haya hecho. En nuestro pa´ıs, gran cantidad de personas transportan la enfermedad, siendo Bol´ıvar el estado que contribuye con el mayor porcentaje de importaci´on de casos (90%), e´ sto posiblemente debido a que Bol´ıvar es un estado minero y e´ sta
´ ´ CAPITULO I. INTRODUCCION
6
actividad influye en la propagaci´on del vector.
Apure aporta 5, 3% de los casos importados seg´un [45]. Una mayor informaci´on de datos de los medios sanitarios, facilitar´ıa la incorporaci´on de este tipo de variables en el modelo de estudio.
Datos hist´oricos y recientes indican que el fen´omeno clim´atico El Ni˜no condiciona un incremento de la densidad de los vectores, el cual afecta con mayor intensidad a Centro y Sur Am´erica. Ejemplo de esto, se observ´o en la cuenca amaz´onica y en las costas del Pac´ıfico de Colombia, Ecuador y Per´u, donde las intensas lluvias ocasionadas por El Ni˜no en los a˜nos 1997 y 1998 ocasionaron la prevalencia de paludismo por P. falciparum.
En el caso de Venezuela y Colombia la incidencia mal´arica se incrementa al a˜no siguiente de dicho fen´omeno, aumentando aproximadamente los casos de malaria en nuestro pa´ıs en un tercio y como esta descrito, posterior a este fen´omeno podr´ıan presentarse condiciones clim´aticas apropiadas para la aparici´on de la malaria en zonas elevadas [5], por tal raz´on las variables clim´aticas podr´ıan explicar el comportamiento del vector en el estado Sucre.
I.1.1 Regi´on de Estudio La regi´on de estudio para este trabajo es el estado Sucre como se muestra en la Figura I.2, el cual es uno de los 23 estados de Venezuela y est´a ubicado a los 10°020 38”N − 10°450 30”N, 61°500 48”W − 61°310 47”W, en la regi´on nororiental del pa´ıs. El estado esta formado por 15 municipios, estos son: Andr´es Eloy Blanco, Andr´es Mata, Arismendi, Ben´ıtez, Berm´udez, Bol´ıvar, Cajigal, Cruz Salmer´on Acosta, Libertador, Mari˜no, Mej´ıa, Montes, Ribero, Sucre y Vald´ez. Adem´as, el estado tambi´en est´a conformado por 54 parroquias, con una superficie de 11800 Km2 .
´ ´ CAPITULO I. INTRODUCCION
7
10°0'42"N
10°30'42"N
Mapa de Ubicación Nacional del Estado Sucre
1:1,150,000 50
25
0
5
0 Km
64°9'47"W
63°39'47"W
63°9'47"W
62°39'47"W
62°9'47"W
Municipios del Edo. Sucre Andres Eloy Blanco
Libertador
Andres Mata
Mariño
Arismendi
Mejia
Benitez
Montes
Bermudez
Ribero
Bolívar
Sucre
Cajigal
Valdez
400 Km
Cruz Salmeron A.
S S ii tt uu aa cc ii óó nn R R ee ll aa tt ii vv aa N N aa cc ii oo nn aa ll
Figura I.2: Distribuci´on de los 15 municipios en el estado Sucre. En cuanto a las caracter´ısticas del estado se destacan las principales actividades econ´omicas, donde predomina la pesca, que aporta la mitad de toda la producci´on nacional (sardina, at´un, caz´on entre otras especies). Esta suministra el 95% de la materia prima para las industrias procesadoras de alimentos marinos. En lo que a la agricultura se refiere, se cultiva ma´ız, batata, ocumo, n˜ ame, yuca, ca˜na de az´ucar, caf´e, cacao, aguacate, cambur, coco y otras frutas. La cr´ıa de ganado vacuno, porcino y de aves de corral tiene cierta importancia, as´ı como la explotaci´on de sal, el azufre y madera. Otras a´ reas de relevancia econ´omica son la industria automotriz, la artesan´ıa y el turismo [25, 26].
En el estado Sucre predomina 60% de formaciones monta˜nosas: el sistema Araya-Paria y el macizo del Turimiquire. La pen´ınsulas de Paria y Araya tienen un relieve monta˜noso de filas bajas, con elevaciones que alcanzan los 1.070 MSNM (metros sobre el nivel del mar), la formaci´on orogr´afica conocida como serran´ıa del Turimiquire est´a caracterizada por altas monta˜nas (de hasta 2.600 MSNM) y valles bastantes hondos, con pendientes superiores a 45%[23].
´ ´ CAPITULO I. INTRODUCCION
8
En cuanto a la hidrograf´ıa en el estado hay dos hoyas hidrogr´aficas: la del Mar Caribe y la del Oc´eano Atl´antico. All´ı se distribuyen los cursos de agua, que en su gran mayor´ıa nacen en la monta˜na del Turimiquire y desembocan en los golfos de Paria y Cariaco. Se destacan 10 rios grandes, dos ca˜nos y tres lagunas. Los embalses de Turimiquire, El Pilar y Clavellino abastecen de agua a casi toda la poblaci´on.
La vegetaci´on en la entidad es de gran variedad, va desde el bosque espinoso tropical hasta el bosque muy h´umedo monta˜na abajo, aunque predomina la vegetaci´on de bosque seco tropical. En la planicie cenagosa costera destacan los manglares, mientras que en otras a´ reas del litoral abundan las formaciones del tipo espinar. Los bosques de las zonas altas menos intervenidas se dividen en trop´ofilos basimontados deciduos, umbr´ofilos submontados semideciduos estacionales y umbr´ofilos montanos siempreverde, en los cuales se incluyen los sub-p´aramos arbustivos [23].
Entre los recursos naturales con los que cuenta el estado se destacan una gran producci´on de gas licuado. Los recursos minerales se limitan a yacimientos de granito, feldespato, yeso y caliza, as´ı como concentraciones de petr´oleo, plomo, sal com´un y asfalto, presente este u´ ltimo en el municipio Ben´ıtez. Posee adem´as un buen potencial geot´ermico, por ejemplo en los municipios Montes, Andr´es Eloy Blanco y Ribero. La pluviosidad del estado var´ıa ostensiblemente de acuerdo con el relieve de la zona, de modo que las mayores precipitaciones ocurren en el a´ rea de monta˜nas. El m´aximo valor anual de 2.300 mm se presenta en la pen´ınsula de Paria y el m´ınimo de 240 mm en la pen´ınsula de Araya. En el Turimiquire alcanza los 1.900 mm. Las lluvias son copiosas entre julio y agosto y m´as escasas de febrero a marzo. La temperatura media oscila entre 12°C y 27°C, aunque algunos sectores pueden superar ampliamente esos registros [23].
´ ´ CAPITULO I. INTRODUCCION
9
I.2 Justificaci´on e Importancia En Venezuela, el crecimiento acelerado de los centros urbanos sin planificaci´on, la falta de servicios sanitarios adecuados, el intercambio de individuos entre a´ reas geogr´aficas diferentes que posibilita el intercambio de la enfermedad, la falta de programas de prevenci´on y la crisis econ´omica constituyen algunos de los factores de propagaci´on del mosquito [34].
Debido al continuo repunte de la malaria en el estado Sucre a lo largo de los a˜nos 1990 − 2002 y siendo este el segundo estado a nivel nacional con mayor ´ındice de esta enfermedad, se considera una regi´on de gran inter´es de estudio. Adem´as, entre otras caracter´ısticas, por la diversidad de su vegetaci´on es una zona donde la enfermedad se expresa de manera heterog´enea espacialmente lo cual influye en la reproducci´on de los vectores.
Se han realizado diversos estudios de la incidencia de la malaria a nivel mundial, aportando ´ Africa y Colombia [41] gran informaci´on en este tema. En Venezuela se ha venido estudiando la malaria como componentes de un sistema ecol´ogico en el Instituto de Zoolog´ıa Tropical (IZT); otros lugares que se estudia esta enfermedad es el Instituto de Geograf´ıa y Desarrollo Regional (IGDR); la escuela de Biolog´ıa y el grupo de Ingenier´ıa Hidrometeorol´ogica (IHM), todos pertenecientes a la Universidad Central de Venezuela.
En la Universidad Sim´on Bol´ıvar se est´a desarrollando un proyecto ambicioso, denominado “Desarrollo de un Repositorio de datos hidro-clim´aticos para la gesti´on de riesgos epidemiol´ogicos y ambientales”; proyecto en el cual se enmarca este trabajo, que contribuir´a a modelar la incidencia de la malaria en el estado Sucre.
Por estas razones se pretende proponer un modelo bayesiano a partir del cual, se puedan estudiar los factores espaciales y temporales que influyen en la presencia de los casos de paludismo y mostrar los municipios donde es m´as probable la transmisi´on de la enfermedad y la aparici´on de
´ ´ CAPITULO I. INTRODUCCION
10
nuevos casos.
I.3 Objetivo General Proponer y ajustar un modelo bayesiano jer´arquico con estructura espacio temporal que permita identificar variables clim´aticas, sociales y econ´omicas asociadas con la incidencia de la malaria en el estado Sucre.
I.4 Objetivos Espec´ıficos • Determinar las variables explicativas que influyen en la incidencia de la malaria ajust´andose al patr´on regional y temporal obtenido. • Ajustar modelos jer´arquicos que representen el comportamiento espacio-temporal de la enfermedad. • Seleccionar el modelo mas adecuado y validar el modelo propuesto. • Determinar la influencia de las variables explicativas seleccionadas en el comportamiento del riesgo relativo.
I.4.1 Estructura del Trabajo En el CAP´ITULO II se desarrolla el marco te´orico, present´andose una introducci´on a la inferencia bayesiana y los modelos jerarquicos. Se habla de la Tasa de Incidencia Estandarizada (TIE) o´ Tasa de Mortalidad Estandarizada (SMR), del software implementado en este trabajo; igualmente del modelo jerarquico bayesiano espacio-temporal propuesto para modelar el comportamiento de los casos de malaria en el estado Sucre. Se introducen el modelo Condicional Auto Regresivo, tambi´en llamado modelo CAR; se calculan las distribuciones condicionales a posteriori de los par´ametros de inter´es para la aplicaci´on del m´etodo Monte Carlo de cadenas de Markov (MCMC). Se definen
´ ´ CAPITULO I. INTRODUCCION
11
los criterios de comparaci´on de modelos, tales como el Criterio de Informaci´on de la Deviancia Bayesiana (DIC)y el Criterio de M´ınima Perdida a Posteriori (tambi´en llamado el Criterio D). Finalmente se realiza el an´alisis de residuos implementando el estad´ıstico I de Mor´an y el p − bayesiano o p-valor predictivo a posteriori. En algunas secciones se muestran algunos ejemplos. En el CAP´ITULO III se describe la construcci´on de la base de datos empleada en el trabajo; se realiza el an´alisis de las variables sociales, econ´omicas y clim´aticas que se consideraron para el modelo jer´arquico bayesiano espacio temporal. En el CAP´ITULO IV se presentan los resultados del modelo seleccionado y el ajuste del modelo. En el CAP´ITULO V las conclusiones y recomendaciones del trabajo y finaliza con el ´ APENDICE donde se presentan 2 secciones definidas como A y B. En la secci´on A se explican los pasos para obtener la interpolaci´on del campo de lluvia mensual de las 23 estaciones del estado Sucre y en la secci´on B los c´odigos implementados en el software libre WinBugs para el modelo ajustado.
´ CAPITULO II ´ MARCO TEORICO En este cap´ıtulo se har´a una introducci´on a los conceptos b´asicos de la inferencia bayesiana; el modelaje de datos areales y enfermedades; se definir´a la Tasa de Incidencia Estandarizada (TIE) o´ Tasa de Mortalidad Estandarizada (SMR). Se introducir´an los modelos espaciales y jer´arquicos para el modelaje de los casos de malaria en el estado Sucre para un a˜no y en particular, se generaliza para cualquier cantidad de a˜nos. Se mencionar´an los modelos Condicional Auto Regresivo, tambi´en llamados modelos CAR; se calcular´an las distribuciones condicionales a posteriori de los par´ametros de inter´es para la aplicaci´on del m´etodo Monte Carlo de cadenas de Markov (MCMC). Se definir´an diversos criterios de comparaci´on de modelos, tales como el Criterio de Informaci´on de la Deviancia Bayesiana (DIC)y el Criterio de M´ınima Perdida a Posteriori (tambi´en llamado el Criterio D). Finalmente se realizar´a el an´alisis de residuos implementando el estad´ıstico I de Mor´an y el p − bayesiano o p-valor predictivo a posteriori. En algunas secciones se mostrar´an algunos ejemplos.
II.0.2 Conceptos Bayesianos B´asicos y Teorema de Bayes Sea X = (x1 , x2 , ..., xn )0 un vector de n observaciones, donde cada componente sigue una distribuci´on de probabilidad p(x| θ) que depende de j par´ametros que conforman el vector θ = (θ1 , θ2 , ..., θ j )0 . Suponga adem´as que θ tiene una distribuci´on de probabilidad p (θ). Entonces, 12
´ ´ CAPITULO II. MARCO TEORICO
13
la distribuci´on conjunta de θ y X viene dada por
p (x, θ) = p (x| θ)p(θ) = p (θ|x) p (x), donde p(θ) es la distribuci´on a priori, p (θ|x) la distribuci´on de probabilidad a posteriori y la distribuci´on de probabilidad condicional de θ dado el vector de observaciones X es
p (θ| x) =
p (x| θ)p (θ) , p (x)
p (x) , 0.
(II.0.1)
La ecuaci´on (II.0.1) se conoce como el Teorema de Bayes, donde p (x) es la distribuci´on de probabilidad marginal de x, la cual se puede expresar como R p (x| θ).p (θ) dθ p (x) = P p (x| θ).p (θ)
si θ es continuo
si θ es discreto.
donde la integral o suma es tomada sobre el espacio param´etrico de θ. As´ı, el Teorema de Bayes puede ser escrito como p (θ| x) = u.p (x| θ).p (θ) ∝ p (x| θ).p (θ). En la expresi´on anterior p (θ| x) representa la distribuci´on a posteriori de θ dado x y u es una constante necesaria para que p (θ| x) sume o integre uno.
Dado que el vector de datos x es conocido a trav´es de la muestra, p (x| θ) es una funci´on de θ y no de x. As´ı, p (x| θ) es conocida como la funci´on de verosimilitud de θ dado x y se denota por l (θ| x). Por lo tanto, la f´ormula de Bayes puede expresarse de la siguiente manera,
p (θ| x) ∝ l (θ| x).p (θ).
(II.0.2)
´ ´ CAPITULO II. MARCO TEORICO
14
II.1 Datos Areales y Modelaje de Enfermedades En epidemiolog´ıa, se desea describir como se distribuye geogr´aficamente cierta enfermedad en una regi´on de estudio. Para ello se hace uso de ciertas herramientas como mapas tem´aticos, en los cuales se representa esta informaci´on con ayuda de sistemas de Informaci´on Geogr´afica (SIG). Ejemplo de ello son los mapas mostrados en este trabajo, los cuales fueron elaborados con el software Arcgis 9.2.
Este tipo de estudio se lleva a cabo utilizando datos areales, los cuales siguiendo [1] se definen como un subconjunto fijo D (D j Rr ), que contiene rect´angulos r-dimensionales (de forma regular o irregular) de volumen positivo, cada rect´angulo est´a particionado en un n´umero finito de unidades de a´ reas con fronteras bien definidas. En nuestro caso dicho subconjunto D es el estado Sucre que est´a subdividido en 15 regiones irregulares, las cual definimos como municipios, tal y como se aprecia en la Figura I.2.
II.1.1 Tasa de Incidencia Estandarizada Como primer paso, a menudo se propone calcular la Tasa de Incidencia Estandarizada (TIE) o´ Tasa de Mortalidad Estandarizada (SMR), la cual se define como la raz´on entre el n´umero de casos observados de la enfermedad (yi ) y el n´umero de casos esperados en la regi´on Ei , es decir, [1] bi = S MRi = T IEi = Ψ
yi , Ei
i = 1, ..., k;
(II.1.1)
siendo k el n´umero de municipios en el estado Sucre, que en nuestro caso es 15. bi es un estimado del riesgo relativo de contraer la enfermedad en el municiEsta tasa o raz´on Ψ pio i. Un valor mayor a 1 en la (TIE), indica una incidencia mayor de la esperada para una regi´on, y por lo tanto constituye una alarma para las autoridades encargadas de la salud p´ublica [44, 30].
´ ´ CAPITULO II. MARCO TEORICO
15
Los valores esperados de casos para cada municipio dependen de la poblaci´on de cada regi´on. Una mayor poblaci´on producir´a un mayor valor esperado y una menor poblaci´on un n´umero menor esperado [44].
El n´umero de casos esperados en la regi´on i se define como Pk yi ∗ Ei = p .ni = Pki=1 .ni , i=1 ni donde p∗ es la proporci´on total de la incidencia de la enfermedad y al multiplicar p∗ por el n´umero de habitantes ni de la regi´on de estudio se obtiene n´umero de casos esperados en la regi´on i, el cual es proporcional al n´umero de habitantes de cada municipio.
Como lo explica [30], este estimador presenta deficiencias, ya que produce grandes cambios en la estimaci´on de la Tasa de Incidencia Estandarizada(TIE) con cambios relativamente peque˜nos en el valor esperado Ei . En casos extremos, cuando Ei esta cercano a cero, el valor de la TIE ser´a un valor muy grande para cualquier cantidad observada. Si se tienen municipios con cero incidencia, se producir´an valores de TIE iguales a cero en todos ellos, y as´ı no se tomar´a en cuenta el valor esperado de casos en cada regi´on [44]. Asimismo, TIE no distingue los ceros en Ei y la varianza es proporcional a 1/Ei , donde el estimador puede ser altamente impreciso para valores peque˜nos de Ei . Para mejorar este estimador, se han desarrollados diversos modelos jer´arquicos bayesianos los cuales tienen un importante papel en la modelizaci´on de la complejidad de la estructura de datos espaciales en epidemiolog´ıa y supera los inconvenientes de la Tasa de Incidencia Estandarizada [30].
A continuaci´on se muestra en la Figura II.1 un ejemplo del c´alculo de los riesgos relativos crudos a partir de la tasa de incidencia y la tasa global observadas en los a˜nos de estudio para 15 municipios del estado Sucre. Al observar el comportamiento de los riesgos relativos, se puede apreciar que la malaria no ha dejado de estar presente en ninguno de los a˜nos estudiados.
´ ´ CAPITULO II. MARCO TEORICO
16
La regi´on este del estado Sucre presenta una variabilidad de riesgos para casi todos los municipios, mientras que para la regi´on oeste del estado, se observa para casi todos los a˜nos un riesgo relativo menor a 0.5; esto se evidencia con mayor fuerza en el municipio Sucre. Otra caracter´ıstica es que para todos los a˜nos el municipio Cajigal presenta un riesgo relativo mayor a 1, lo que da indicio a pensar que este municipio sea una regi´on mal´arica cr´ıtica en el estado.
Año 1990
Año 1991
Año 1993
Año 1992
Año 1995
Año 1994
Año 1996
Año 1997
Año 1998
Año 1999
Año 2000
Año 2001
Barbados
Aruba
Grenada
Año 2002 100 Km
Venezuela Guyana
Mayor que 1
Colombia
Brazil
N
0-1
S S ii tt uu aa cc ii óó nn R R ee ll aa tt ii vv aa N N aa cc ii oo nn aa ll dd ee ll ee ss tt aa dd oo S S uu cc rr ee
Figura II.1: Mapas de riesgos relativos observados en los 15 municipios del estado Sucre durante los a˜nos 1990 − 2002
´ ´ CAPITULO II. MARCO TEORICO
17
Como se observa en la Figura II.1 la enfermedad est´a presente en los a˜nos 1990 − 2002, e´ sto muestra que el riesgo de contraer la enfermedad siempre est´a presente. Por lo tanto, el objetivo de este trabajo es proponer un modelo que incluya el componente espacial y temporal para explicar la din´amica del vector y que al mismo tiempo permita identificar las variables explicativas socioecon´omicas y clim´aticas relacionadas con la incidencia de la enfermedad en el estado Sucre.
II.2 Modelos que Mejoran el Estimador (TIE) Los autores de [7] introducen el modelo jer´arquico y la asociaci´on de la inferencia emp´ırica Bayesiana para regiones espec´ıficas estandarizadas de radios TIE, las cuales permiten una correlaci´on espacial entre vecinos de una determinada regi´on. [4] extiende esta idea bayesiana implementando las cadenas de Markov Monte Carlo. Para 1989, [27] proporciona una visi´on general del m´etodo emp´ırico de Bayes, mientras que [33] proporciona la introducci´on exhaustiva a la aproximaci´on bayesiana. [7, 4] motivan recientemente la literatura a cerca de los modelos relacionados con el mapeo de enfermedades, los cuales se desarrollan en la siguiente secci´on.
II.3 Modelo Espacial II.3.1 Modelo Poisson-Gamma Inicialmente, se supone una regi´on de inter´es, en nuestro caso el estado Sucre, la cual ha sido dividida en k sub-regiones (municipios) contiguos y Yi representa el n´umero de casos de malaria para cada a´ rea de la enfermedad, con i = 1, ..., k. En epidemiolog´ıa se supone para este tipo cantidad de enfermedades un modelo Poisson, donde la media es λi = Ei Ψi , as´ı, Yi ∼ Poisson(λi ), Ψi ∼ Gamma(a, c)
a > 0, c > 0.
(II.3.1)
´ ´ CAPITULO II. MARCO TEORICO
18
donde Ei es el n´umero esperado de casos de malaria para cada municipio i siendo este valor conocido, mientras que el riesgo relativo Ψi es el valor a estimar. En este caso el estimador de m´axima verosimilitud resulta ser el expresado en (II.1.1), pero como se menciona en la secci´on II.1.1, este estimador presenta inconvenientes, como por ejemplo cuando la enfermedad es rara y las a´ reas de estudio son peque˜nas [33, 36] no se captura la dependencia espacial. Otro aspecto a considerar es la homogeneidad dentro de cada a´ rea, donde el riesgo Ψi se espera que sea igual dentro de la zona. Los par´ametros (a, c) en (II.3.1) pueden tener valores predeterminados, pero por lo general el investigador no tiene una idea clara del comportamiento de e´ stos valores a priori, aunque estos se pueden estimar a partir de los datos originales. Como se menciona en [28] una elecci´on a considerar es a = 0.5 y c = 0.0005. Esto produce una media
a c
= 1000, con una varianza o dispersi´on
a c2
= 2 × 106 [44].
Para el modelo Poisson-Gamma de la ecuaci´on (II.3.1) se presentan dos niveles de jerarqu´ıa: Ψi tiene una distribuci´on Gamma(a, c) de primer orden y a puede tener una distribuci´on hiperpriori (ha ), como la podr´ıa tener c (hc ), la cual corresponde al segundo nivel de jerarqu´ıa. Esto se muestra en la Figura II.2, la cual describe los niveles estoc´asticos de la jerarqu´ıa. Los cuadros representan valores conocidos por el investigador y los par´ametros son los nodos (elipses) en los extremos de las l´ıneas [30].
´ ´ CAPITULO II. MARCO TEORICO
19
υ
ρ
a
c ψ
Y Figura II.2: Dos niveles de jerarqu´ıa para el modelo Poisson-Gamma Es evidente la importancia de poner fin a una jerarquizaci´on en un lugar adecuado; de lo contrario se podr´ıa suponer una jerarqu´ıa infinita de par´ametros. Por lo general, la l´ınea de corte se elige en los puntos donde se encuentra la variaci´on en los par´ametros a y c y e´ stos se podr´ıan asumir uniformes. Los datos podr´ıan no dar una informaci´on acerca de la distribuci´on de todos los par´ametros.
Este modelo tambi´en puede escribirse de la forma yi |Ψ ∼ Poisson(Ei Ψ), Ψ| a, c ∼ Gamma(a, c), a|υ ∼ ha (υ), c|ρ ∼ hc (ρ),
La distribucu´on a posteriori para e´ ste tipo de modelos tiene una forma conocida dada la conjugacidad de la distribuci´on gamma a priori con la verosimilitud de la distribuci´on Poisson [1]. As´ı,
´ ´ CAPITULO II. MARCO TEORICO
20
el riesgo relativo para Ψi , siendo conocidos a y c viene dado por, Ψi ∼ Gamma(Yi + a, Ei + c). La media a posteriori en la ecuaci´on anterior viene dada por E[Ψi |Yi , a, c] =
a + yi a = wi S MRi + (1 − wi ) , c + Ei c
donde Ei , 0 ≤ wi ≤ 1. (II.3.2) c + Ei As´ı, (II.3.2) es la media ponderada de los datos basados en S MRi para el municipio i y la media wi =
a priori
a c
[1]. Para enfermedades raras y a´ reas peque˜nas la varianza es grande, as´ı el peso wi es
peque˜no (cercano a 0) y la media a posterior tiende a la media global ac , produciendo as´ı un suavizamiento en el mapa resultante. En a´ reas con gran cantidad de datos, la media posterior del riesgo relativo tiende a
yi Ei
[30]. Finalmente, esta estimaci´on es aproximadamente igual a S MRi cuando wi
es cercano a 1 (es decir, cuando Ei es grande) lo que significa que los datos son altamente informativos o cuando la varianza es grande [1].
Como lo menciona [44] es conocido que ante eventos naturales, los municipios presenten las mismas car´acteristicas (o parecidas) y se desarrollen patrones similares, los cuales inciden en el riesgo relativo de los municipios de la regi´on, pero que escapan de las covariables socio-econ´onicas o clim´aticas escogidas en el modelo para representar el riesgo. Es por ello que se sugiere incluir un efecto de correlaci´on espacial con el fin de absorber o modelar esas covariables (socio-econ´omicas, clim´atcas, etc) no explicada por el modelo. Por tal raz´on se procede a considerar un modelo Condicional Auto Regresivo (CAR), el cual incorpora informaci´on de los municipios contiguos.
II.3.2 Modelo Log-Poisson Los autores de [7] proponen un modelo log-normal para el riesgo relativo (Ψi ) en el caso que los datos presenten covariables espaciales explicativas del modelo (denotado por la matriz Xi ).
´ ´ CAPITULO II. MARCO TEORICO
21
Adem´as, [4] expande esta idea para incluir la influencia de la tasa global de la enfermedad en la i-´esima a´ rea de estudio y relacionar la distribuci´on espacial de los vecinos adyacentes, esto es, Yi ∼ Poisson(λi ), Ψi = eα+β.Xi +vi +bi ,
(II.3.3)
donde α y β son vectores de coeficientes de regresi´on, λi = Ei Ψi y vi es el coeficiente que capta la heterogeneidad espacial del modelo, tal que vi ∼ N(0, τ1v ), con τv el par´ametro de precisi´on, pues es el inverso de la varianza de la distribuci´on normal[44]. Se utiliza la precisi´on en vez de la varianza, pues su distribuci´on a posteriori es mas sencilla y el paquete estad´ıstico WinBugs hace uso de esta par´ametrizaci´on.
El componente bi captura el comportamiento de los vecinos alrededor del municipio de estudio. Este par´ametro es estudiado con mayor detenimiento en la siguiente secci´on.
II.4 Modelo Condicional Auto Regresivo (CAR) Si se desea que en el modelo a implementar la adyacencia de los municipios contiguos influya, se considera un modelo Condicional Auto Regresivo (CAR), el cual posee un efecto aleatorio bi , que captura la influencia de los vecinos. Si se consideran el vector de par´ametros b = (b1 , b2 , ..., bn ), entonces el modelo CAR propone que la densidad condicional bi |b j , j , i es X −γ Wi j b j )2 , exp (ai bi − 2 j,i donde, W ≥ 0 es la matriz que refleja la influencia de b j en la esperanza de bi . En particular para el estado Sucre, cada columna de esta matriz W representa un municipio (desde el municipio 1 hasta el 15) y se define como,
´ ´ CAPITULO II. MARCO TEORICO W =
22
0 1 0 1 0 0 0 0 0 0 0 0 1 0 0
,
1 0 0 1 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 1 0 1 1 0 0 0 0 1 1 1 1 0 1 0 0 0 1 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 0 0 1 0 1 1 0 1 0 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0
(II.4.1)
W es una matriz sim´etrica con valores iguales a 1 (uno) si la unidad espacial a la que le corresponde la fila i y la unidad espacial a la que le corresponde la columna j tiene alg´un tramo de frontera en com´un, mientras que los elementos 0 (cero) significa que no tiene ning´un tramo de frontera en com´un y donde ai > 0 representa el tama˜no muestral asociado con el municipio i. [3] demostr´o que la densidad conjunta del vector de efectos espaciales b es proporcional a exp
−γ 2
bT Bb ,
con Bii = ai y Bi j = −ai Wi j . Si B es una matriz semidefinida positiva, esto corresponde a una densidad normal multivariada con media 0 y matriz de covarianza B−1 . Por lo general, a γ se le asigna una previa gamma. [4] propone una aproximaci´on para γ, definiendo un conjunto δi de vecinos del i-´esimo municipio. Estos vecinos pueden ser definidos como municipios adyacentes al municipio i o´ como municipios con una densidad poblacional prescrita por el municipio i. Si se
´ ´ CAPITULO II. MARCO TEORICO
23
define mi como el n´umero de vecinos al municipio i y 1 m i Wi j = 0
si j ∈ δi otro caso.
Adem´as si ai = mi , B es sim´etrica, entonces se puede establecer que ! 1 , (II.4.2) bi |b j , j , i ∼ N bi , τ b mi P donde bi = m−1 ametro de escala. Es claro que B es singular, ya i, j b j , τb corresponde al par´ i que las sumas de todas las filas o´ todas las columnas es 0. De esta forma, la densidad conjunta es impropia.
Los modelos CAR son muy convenientes computacionalmente, ya que el m´etodo de hallar la distribuci´on a posteriori de γ es un algoritmo condicional y por lo tanto se puede resolver utilizando el muestreador de Gibbs [1] lo cual produce buenas estimaciones en las tasas de enfermedad.
II.5 Modelo Espacio-Temporal Como se ha mostrado en las secciones anteriores, el modelo empleado en (II.3.3) es para un a˜no en particular. El objetivo de este trabajo es construir un modelo bayesiano considerando diferentes a˜nos simult´aneamente, as´ı, el modelo (II.3.1) se puede extender para cualquier cantidad de a˜nos suponiendo Yit ∼ Poisson(λit ),
(II.5.1)
donde λit = Eit Ψit . Para este trabajo se plantea representar el riesgo relativo con las ecuaciones (II.5.2) y (II.5.3), donde para cada a˜no se calcula el riesgo relativo (Ψit ), esto es,
´ ´ CAPITULO II. MARCO TEORICO
24
Ψit = exp(αt + βt .Xit + vit ),
(II.5.2)
Ψit = exp(αt + βt .Xit + vit + bit ),
(II.5.3)
donde para cada a˜no t = 1, ...T y cada municipio i = 1, ..., k los vectores αt = (α1 , α2 , ..., αT ), βt = (β1 , β2 , ..., βT ), τht = (τh1 , τh2 , ..., τhT ), τbt = (τb1 , τb2 , ..., τbT ), bit = (b1t , b2t , ..., bkt ) , vit = (v1t , v2t , ..., vkt ) y Xit representa la matriz de covariables, donde la fila i representa el municipio y t el a˜no (columna).
El modelo (II.5.2) es considerado un modelo simple, y como es claramente anidado en el modelo (II.5.3) el cual incluye el efecto CAR, e´ ste u´ ltimo fu´e el elegido. Para e´ ste modelo se consideraron las distribuciones condicionales completas a posteriori de los par´ametros αt , βt , bit , vit , τbt ,τht .
II.5.1 Distribuciones Condicionales a Posteriori Sean las distribuciones a priori αt ∝ 1, βt ∝ 1, vit ∼ N(0, 1/τht ), ! 1 ¯ , bit |b−it ∼ N bit , τbt mit τht ∼ Gamma(ah , dh ), τbt ∼ Gamma(ac , dc ),
(II.5.4)
donde b−it se refiere al conjunto de todos los datos excepto el i-´esimo, mit se define como el n´umero de municipios adyacentes al municipio i en el tiempo t; aunque no cambia en el tiempo el n´umero
´ ´ CAPITULO II. MARCO TEORICO
25
de municipios, se podr´ıa suponer solamente mi , pero como se quiere expresar las distribuciones condicionales a posteriori en general se va a considerar mit . b−it se define como el par´ametro en el cual se le ha sustraido el municipio i. Distribuci´on Condicional a Posteriori para αt P(α|Y, β, τb , τh , v, b) ∝ P(Y|α, β, τb , τh , v, b)P(α, β, τb , τh , v, b) aplicando la ecuaci´on (II.0.2). Como la verosimilitud no depende de los par´ametros τb y τh , se tiene que P(α|Y, β, τb , τh , v, b) ∝ P(Y|α, β, τb , τh , v, b)P(α, β, τb , τh , v, b) ∝ P(Y|α, β, v, b)P(α|β, τb , τh , v, b)P(β, τb , τh , v, b) ∝ P(Y|α, β, v, b)P(α) T Y n Y (Eit exp(αt + βt · Xit + vit + bit ))yit × ∝ t=1 i=1
exp(−Eit exp(αt + βt · Xit + vit + bit ))1 n n T Y X X exp −Eit exp(αt + βt · Xit + vit + bit ) exp αt yit ∝ t=1 i=1 i=1 T n X X −Eit exp(αt + βt · Xit + vit + bit + αt yit ) . ∝ exp t=1 i=1
Distribuci´on Condicional a Posteriori para βt Usando el mismo razonamiento anterior para βt , se tiene que T n X X P(β|Y, α, τb , τh , v, b) ∝ exp −Eit exp(αt + βt · Xit + vit + bit ) + βt yit · Xit . t=1 i=1
Distribuci´on Condicional a Posteriori para cada Efecto CAR bit
P(bit |b−it Y, β, α, τb , τh , v) ∝ P(Y|b, β, α, τb , τh , v)P(b|β, α, τb , τh , v)P(β, α, τb , τh , v)
´ ´ CAPITULO II. MARCO TEORICO
26
Como la distribuci´on de los par´ametros β, α, τh y v no es funci´on del vector b, y aplicando la verosimilitud y la distribuci´on a priori para b, se cumple que P(bit |b−it Y, β, α, τb , τh , v) ∝ P(Y|b, β, α, v)P(b|τb ) T Y n Y ∝ (E jt exp(αt + βt .X jt + v jt + b jt ))y jt × t=1 j=1
exp(−E jt exp(αt + βt .X jt + v jt + b jt )) × n τb m jt X (b jt − b¯ jt )2 exp − 2 j=1
∝
T Y n Y t=1
exp(b jt y jt ) exp(−E jt exp(αt + βt .X jt + v jt + b jt )) ×
j,i
n τb m jt X 2 (b jt − b¯ jt ) × exp − 2 j,i
exp(bit yit ) exp(−Eit exp(αt + βt .Xit + vit + bit )) × τm b it 2 ¯ (bit − bit ) exp − 2 T X τ m b it (bit − b¯ it )2 ) ∝ exp (−Eit exp(αt + βt .Xit + vit + bit ) + bit yit − 2 t=1 Distribuci´on Condicional a Posteriori para cada Efecto de Heterogeneidad vit
P(vit |v−it Y, β, α, τb , τht , v) ∝ P(Y|b, β, α, τbt , τht , v)P(v|β, α, τb , τht , v)P(β, α, τbt , τht , b) ∝ P(Y|b, β, α, τbt , τht , v)P(v|τht ) T Y n Y ∝ (E jt exp(αt + βt .X jt + v jt + b jt ))y jt × t=1 j=1
n τht X v2jt exp(−E jt exp(αt + βt .X jt + v jt + b jt )) exp 2 j=1 ∝
T Y n Y t=1
j,i
exp(v jt y jt ) exp(−E jt exp(αt + βt .X jt + v jt + b jt ))
´ ´ CAPITULO II. MARCO TEORICO n τht X v2jt exp(vit yit ) × ∝ exp 2 j=1 exp(−Eit exp(αt + βt .Xit + vit + bit )) exp ∝
T Y t=1
27
τ
ht 2 vit
2
τht 2 exp vit yit − Eit exp(αt + βt .Xit + vit + bit ) + vit 2
Distribuci´on Condicional a Posteriori para τbt El razonamiento para calcular esta distribuci´on a posteriori presenta un cambio debido a la jerarqu´ıa del par´ametro en el modelo. P(τbt |Y, α, β, , τht , v, b) ∝ P(Y|α, β, τbt , τht , v, b)P(α, β, τbt , τht , v, b) ∝ P(Y|α, β, τbt , τht , v, b)P(b|α, β, τbt , τht , v)P(τbt |α, β, τht , v) × P(α, β, τht , v) ∝ P(b|τbt )P(τbt ) T τ Y bt ¯ it )2 τac −1 exp(−dc τbt ) (b − b τn/2 exp ∝ it bt bt 2 t=1 Distribuci´on Condicional a Posteriori para τht Realizando un razonamiento an´alogo al anterior y ciertas manipulaciones algebraicas, se tiene que P(τht |Y, α, β, τbt , v, b) ∝ P(Y|α, β, τbt , τht , v, b)P(α, β, τbt , τht , v, b) ∝ P(Y|α, β, τbt , τht , v, b)P(v|α, β, τbt , τht , b)P(τht |α, β, τbt , b) P(α, β, τbt , b) ∝ P(v|τht )P(τht ) n T X Y 1 n/2+ah −1 2 v ∝ τht exp −τ d + ht h it 2 i=1 t=1
´ ´ CAPITULO II. MARCO TEORICO
28
II.6 M´etodos Monte Carlo de Cadenas de Markov (MCMC) Una cadena de Markov es una secuencia de estados de un proceso estoc´astico donde los estados dependen de probabilidades de transici´on. Algunas observaciones importantes sobre las cadenas de Markov son que cada punto en la cadena tiene una correlaci´on con el punto que lo precede.
El m´etodo de Monte Carlo es no determin´ıstico o estad´ıstico num´erico usado para aproximar expresiones matem´aticas complejas y costosas de evaluar con exactitud.
La idea principal del m´etodo es hacer muchas repeticiones para reconocer el comportamiento del sistema. Adem´as estas simulaciones siempre se hacen mediante un generador de n´umeros aleatorios.
Una limitaci´on importante a la aplicaci´on m´as generalizada del enfoque bayesiano es que la obtenci´on de la distribuci´on a posteriori a menudo requiere la integraci´on de funciones de alta dimensionalidad. Esto puede ser computacionalmente muy dif´ıcil, pero diversos autores han hecho propuestas para mejorar el m´etodo (ver [49, 15, 52]).
Actualmente, en la estad´ıstica bayesiana el m´etodo Monte Carlo de cadenas de Markov (MCMC) es altamente utilizado con e´ xito, siendo la base de paquetes computacionales como WinBugs, por su capacidad para encontrar aproximaciones de modelos complicados y de alta dimensionalidad.
Existen t´ecnicas b´asicas en e´ ste m´etodo como: El algoritmo de Metropolis Hasting y el Muestreador de Gibbs que se explican someramente a continuaci´on.
´ ´ CAPITULO II. MARCO TEORICO
29
II.6.1 Muestreador de Gibbs Esta t´ecnica permite el an´alisis de modelos complejos mediante la descomposici´on y el muestreo de las distribuciones condicionales completas. Adem´as este muestreador aproxima integrales que no pueden ser calculadas en forma cerrada generando cadenas de Markov Monte Carlo (MCMC), donde la transici´on del origen de la distribuci´on f (θ) esta constituida por las distribuciones condicionales completas fi (θi ) = fi (θi |θ−i ). La distribuci´on de inter´es es f (θ), con θ = (θ1 , ..., θ p )0 , cada uno de estos componentes pueden ser un escalar o´ una matr´ız. adem´as que las distribuciones condicionales completas est´an disponibles, es decir, se conocen completamente y por lo tanto se puede tomar muestras de ellas.
El problema que se debe resolver es c´omo tomar una muestra de la distribuci´on f , cuando los planes para la generaci´on de las muestras son costosos, complicados o simplemente no se conoce el origen de la distribuci´on f , pero es posible generar muestras de las distribuciones fi (θi ). El muestreador de Gibbs provee un plan alternativo para la generaci´on de estas muestras basadas en generaciones sucesivas de las distribuciones condicionales completas.
El algoritmo implementado, se menciona a continuaci´on: 1. Se comienza desde una iteraci´on inicial arbitraria y se asignan valores iniciales θ0 = (θ10 , ..., θ0p )0 . 2. En la iteraci´on j-´esima se obtiene un nuevo valor θ j = (θ1j , ..., θ pj )0 a partir de θ j−1 por la
´ ´ CAPITULO II. MARCO TEORICO
30
generaci´on sucesiva de los siguientes valores θ1j ∼ f (θ1j |θ2j−1 , ..., θ pj−1 ) θ2j ∼ f (θ2j |θ1j−1 , θ3j−1 , ..., θ pj−1 ) .. . j θdj ∼ f (θdj |θ1j−1 , ..., θ p−1 )
3. Se actualiza el contador de j a j + 1 y se repite el paso 2. 4. Este algoritmo se repite hasta que la convergencia sea alcanzada. Las condiciones de convergencia para el muestreador de Gibbs fueron establecidas por [50]. Cuando la cadena converge, los valores resultantes de θ j son una muestra de la distribuci´on f . Se asume la convergencia de la cadena si la cadena se aproxima a una condici´on de equilibrio cuando el n´umero de iteraciones se incrementa [18]. Los resultados son presentados en t´erminos de espacios par´ametricos, pero pueden extenderse y combinar los par´ametros continuos y discretos. Un valor de la distribuci´on de inter´es f solamente es obtenido cuando el n´umero de iteraciones de la cadena se aproxima a infinito. En la pr´actica esto no es posible, y un valor obtenido en una iteraci´on suficientemente grande es tomado como una muestra de la distribuci´on f . Sin embargo, [30] sugieren realizar al menos 2000 iteraciones al implementar el programa WinBugs para observar como se comporta aproximadamente la convergencia de la cadena. Otros autores como [20] sugieren el chequeo informal de la convergencia basada en t´ecnicas gr´aficas.
II.6.2 El Algoritmo de Metr´opolis-Hasting En simulaciones de cadenas de Markov, se crean muchas secuencias de muestras simuladas. Cada secuencia, θr , r = 1, 2, ..., se produce comenzando de alg´un punto inicial θ0 y entonces, para cada
´ ´ CAPITULO II. MARCO TEORICO
31
r, se simula de una distribuci´on de probabilidades de transici´on Fr (θr |θr−1 ). Estas distribuciones deben ser construidas de tal forma que la cadena de Markov converja a p(θr |y). La referencia al algoritmo de Metropolis-Hasting corresponde a un t´ermino general que se utiliza para una familia de m´etodos de simulaci´on de cadenas de Markov que se derivan del siguiente algoritmo propuesto por [37]. Algoritmo de Metr´opolis El algoritmo de Metr´opolis es una modificaci´on de un paseo al azar que utiliza una regla de aceptaci´on y rechazo para obtener convergencia de la cadena a una distribuci´on espec´ıfica. El algoritmo consiste de los siguientes pasos:
1. Simular un punto inicial para el cual p (θ0 |y) > 0 a partir de una distribuci´on inicial p0 (θ); con θ0 alg´un punto inicial. Esta distribuci´on puede estar basada en una distribuci´on aproximada o simplemente se pueden seleccionar valores iniciales aproximados. 2. Para r = 1, 2, ... (pasos)
a Obtener una realizaci´on candidata θ∗ de una distribuci´on de salto para el tiempo r, Jr (θ∗ |θr−1 ). b Calcular el cociente de las densidades, R=
p(θ∗ |y) p(θr−1 |y)
c Se define θr = θ∗ con probabilidad min(R, 1) y θr = θr−1 en otro caso. Dado el valor actual θr−1 , la distribuci´on de transici´on Fr (θr |θr−1 ) de la cadena de Markov es una mezcla de una masa puntual en θr = θr−1 y una versi´on ponderada de una distribuci´on de salto, Jr (θr |θr−1 ) que se ajusta para la tasa de aceptaci´on. Se puede probar que la secuencia de iteraciones de este algoritmo converge a la distribuci´on objetivo.
´ ´ CAPITULO II. MARCO TEORICO
32
II.6.3 Generalizaci´on del Algoritmo de Metr´opolis- Hastings La generalizaci´on conocida como el algoritmo de Metr´opolis-Hasting, consiste esencialmente en que en este caso las reglas de salto, dadas por Jr no necesitan ser sim´etricas y el radio R es reemplazado por, R=
p(θ∗ |y)/Jr (θr |θr−1 ) . p(θr−1 |y)/Jr (θr−1 |θ∗ )
La ventaja de este m´etodo es que aumenta la velocidad del paseo al azar.
II.7 Criterios Empleados para Escoger el Mejor Modelo Jer´arquico Areal Si se desean comparar varios modelos para determinar cual de ellos posee mayor precisi´on predictiva, por lo general se escogen dos o´ mas m´etodos de comparaci´on. En nuestro caso hemos escogido el Criterio de Informaci´on de Devianza (DIC) y el Criterio de M´ınima Perdida Predictiva a Posteriori (D), para poder predecir cual modelo posee mayor precisi´on predictiva.
II.7.1 Criterio de Informaci´on de Devianza (DIC) El Criterio de Informaci´on de la Desvianza (DIC) es una generalizaci´on de los modelos jer´arquicos AIC (Criterio de informaci´on de Akaike) y BIC (Criterio de Informaci´on Bayesiano, tambi´en conocido como el Criterio de Schwarz), el cual fu´e propuesto por [51]. Es u´ til en el modelo bayesiano de selecci´on de problemas, donde la distribuci´on posterior de los modelos se han obtenido por las simulaciones de las cadena de Markov Montecarlo (MCMC). Al igual que el AIC y el BIC se trata de una aproximaci´on asint´otica siempre que el tama˜no de la muestra tienda a ser grande. Esto es v´alido cuando la distribuci´on a posterior es aproximadamente normal multivariada. El DIC est´a basada en la distribuci´on a posteriori del estad´ıstico de la devianza, esto es DIC = D(θ) = −2log( f (y| θ)) + 2log(h(y))),
(II.7.1)
´ ´ CAPITULO II. MARCO TEORICO
33
donde f (y| θ) es la funci´on de verosimilitud, y es el vector de datos, θ corresponde a todos los par´ametros en el modelo y h(.) es la funci´on de escalamiento que depende solo de los datos.
Se sugiere resumir el ajuste a un modelo por la esperanza a posteriori de la devianza, D¯ = Eθ|y [D(θ)]. Esta cantidad puede ser estimada utilizando las simulaciones MCMC de θi [6], D¯ = Eˆ θ|y [D(θ)] =
N X D(θi ) i=1
N
.
(II.7.2)
La complejidad del modelo se define por el n´umero efectivo del par´ametro, esto es, ¯ p D = Eθ|y [D(θ)] − D[Eˆ θ|y (θ)] = D¯ − D(θ).
(II.7.3)
As´ı, el Criterio de Informaci´on de la Devianza (DIC), se define como ¯ DIC = D¯ − p D = 2D¯ − D(θ).
(II.7.4)
N´otese que usando las ecuaciones (II.7.2) y (II.7.3), tambi´en puede escribirse DIC = D¯ + p D , es decir, el Criterio de Informaci´on de la Desvianza puede verse como la suma de una medida de discrepancia (la devianza promedio a posteriori) y una medida de complejidad (el n´umero efectivo de par´ametros pD ) [6]. Se espera, por lo tanto que un buen modelo tenga un DIC bajo, pues indica un buen ajuste del modelo [1]. N´otese adem´as que las cantidades involucradas en el c´alculo del DIC se pueden obtener f´acilmente usando resultados de simulaciones. Este hecho ha popularizado el uso del DIC como estrategia de selecci´on de modelos. En general, se dir´a que un modelo es mejor que otro cuando su DIC es sustancialmente menor [6].
Como se menciona en [6] algunos autores recomiendan los siguientes criterios generales al momento de comparar los modelos:
´ ´ CAPITULO II. MARCO TEORICO
34
• Diferencias de mas de 10 en el DIC permiten descartar el modelo con el DIC mas alto. • Diferencias entre 5 y 10 pueden considerarse sustanciales. • Cuando la diferencia es menor que 5 y los modelos hacen diferencias, reportar s´olo el modelo con el menor DIC puede llevar a conclusiones err´oneas. Por lo tanto, minimizar el DIC significa obtener un compromiso entre el buen ajuste y un n´umero de par´ametros no muy elevado, pues esto puede dar lugar a un sobre-ajuste en el modelo.
Para nuestro estudio, el DIC ser´a calculado por el programa WinBugs.
II.7.2 Criterio de M´ınima P´erdida Predictiva (D) Otra alternativa adem´as del DIC, es implementar el criterio de M´ınima Perdida Predictiva, el cual como lo comenta [44] fu´e propuesto por [29] y extendido por [17]. El criterio se basa en seleccionar el mejor modelo entre los modelos tentativos, que posean menor D [44], mediante la generaci´on de nuevas r´eplicas de los datos observados, yi,obs , con i = 1, .., k. El criterio es calculado como D = G + P,
(II.7.5)
donde, G =
N X
(µi − yi, obs )2 ,
i=1
P =
N X
σ2i .
(II.7.6)
i=1
En (II.7.6) µi = E(Yi,rep | y), es la media predictiva a posteriori, y σ2i = Var(Yi,rep | y), la cual corresponde a la varianza. Para la ecuaci´on (II.7.5), G es el componente de capacidad predictiva y P es un componente de
´ ´ CAPITULO II. MARCO TEORICO
35
penalizaci´on por sobre-ajuste.
Si el valor esperado de las predicciones a futuro es parecido a los datos que ya se han observado, simulaciones a partir de la predictiva ser´an similares a los datos, en promedio. Con esto se podr´a decir que el modelo representa o explica (aproximadamente) el mecanismo que gener´o esos datos observados. Por tal motivo se dice que el componente G cuantifica la capacidad del modelo de reproducir los datos observados [44], lo cual es deseable.
Para un modelo pobre, se espera una gran varianza predictiva y un mal ajuste (G y P). A medida que el modelo mejora, se espera mejorar ambos t´erminos. Sin embargo, a medida que comenzamos a sobre-estimar, tambi´en mejoramos la bondad de ajuste del modelo, pero incrementamos (artificialmente) la varianza a medida que introducimos multicolinealidad. Eventualmente, la resultante penalidad de la varianza predictiva (artificialmente incrementada) exceder´a la ganancia en la bondad de ajuste [1].
As´ı, como el DIC, este criterio, escoge aquel modelo con menor valor D. Note que los valores µi y σ2i , pueden ser calculados de muestras de la distribuci´on a posteriori. Si el modelo presenta g par´ametros, θ(g) , entonces, Z p(yi,rep | θ(g) )p(θ(g) | y) dθ(g) , p(yi,rep | y) = donde yi,rep = (y1,rep , ..., yk,rep ) son r´eplicas de los datos de Y. Por consiguiente, cada muestra a posterior (θ∗ ) puede ser usada para obtener el correspondiente yi,rep de p(yi,rep | θ(g) = θ∗ ). La muestra resultante y∗i,rep presenta una distribuci´on marginal p(yi,rep | y). Con muestras de estas distribuciones, se puede obtener µi y σ2i [1].
´ ´ CAPITULO II. MARCO TEORICO
36
Debido a que nuestro modelo es espacio-temporal, el criterio anterior se generaliza a t a˜nos e incorpora al modelo (II.5.3) Los pasos que se siguieron para calcular dicho criterio se presentan a continuaci´on: 1. Se supone estacionalidad en las cadenas de Markov para cada iteraci´on n = 1, ..., N y cada a˜no t = 1, ..., T . (n) (n) (n) (n) (n) (n) (n) 2. Se escogen muestras φ(n) donde φ ∼ P(φ|y), = αt , βt , vit , bit , τht , τbt , con i = 1, ..., k. it it 3. Se obtiene el riesgo Relativo Ψ(n) it = exp(αt + βt · Xit + vit + bit ). 4. Se generan replicas y(n) no y cada municipio de la distribuci´on it, rep para cada a˜ (n) Yit, rep |Ψ(n) it ∼ Poisson E it Ψit 5. Regresar al paso 2 hasta que i = k, t = T y n = N. Luego de tomar todas las y(n) it,rep generadas, se debe calcular el valor aproximado del criterio para cada a˜no t k N T X X X 2 1 (n) (n) y − y D = D(N, T, k) = it, rep it, obs N t=1
i=1
n=1
II.8 Estudio de los Residuos del Modelo Escogido el modelo mediante los criterios D y DIC, el siguiente paso es estudiar el comportamiento de los residuos de dicho modelo, los cuales se definen para cada a˜no t y cada municipio i como N 1 X (n) Ψit , rit = yit − Eit . N n=1 donde Eit es el n´umero de casos esperados en el municipio i en el a˜no t; yit son los valores observados de casos de malaria para cada a˜no; Ψ(n) on a posteriori del riesgo it es la muestra de la distribuci´
´ ´ CAPITULO II. MARCO TEORICO
37
relativo, la cual es construida a partir de muestra de los par´ametros seg´un el modelo para cada a˜no.
Se debe verificar gr´aficamente el comportamiento de los residuos, es decir, no se deben presentar patrones o´ c´umulos en los signos de los residuos para cada a˜no. Ejemplo de esto se muestra la Figura II.3, lo cual corresponde a los residuos del a˜no 1998 para los 15 municipios del estado Sucre. No se presentan c´umulos de signos a lo largo del mapa, sino que estos est´an distribuidos de forma aleatoria.
+
10°30'0"N
N
-
- + 64°0'0"W
+
-
+
-
+
+
- + Leyenda
-
+
Municipios Estado Sucre Estados de Venezuela 50 Km
63°0'0"W
62°0'0"W
Figura II.3: Residuos del modelo escogido en el a˜no 1998 Otra manera de verificar esto de forma anal´ıtica, es utilizando el estad´ıstico I de Mor´an [43, 14], el cual es una medida de la autocorrelaci´on espacial usada ampliamente desde 1990 y mide si hay estructura de autocorrelaci´on en los residuos del modelo.
La I de Mor´an es un estad´ıstico global que considera los valores de todas las observaciones. Si bien este no permite evaluar la estructura local de la autocorrelaci´on espacial, si muestra la existencia de aglomeraciones espaciales locales en torno a valores superiores o inferiores a la media de todas las observaciones e indica cuales son las regiones que contribuyen m´as a la autocorrelaci´on espacial global. Las medidas originales de dependencia espacial desarrolladas por Moran [32] y Geary, estan basadas en las nociones de contig¨uidad binaria entre unidades espaciales. Siguiendo e´ sta idea, para utilizar e´ ste estad´ısitico con el modelo escogido, se procedi´o a construir la matriz de
´ ´ CAPITULO II. MARCO TEORICO
38
vecinos de los 15 municipios del estado Sucre,W, la cual est´a definida en (II.4.1).
Como en el per´ıodo de estudio (1990 − 2002) la estructura de los municipios no se ha alterado, entonces e´ sta matriz ser´a la misma para todos los a˜nos.
Como se presenta en [16] hay diversas formas de construir la matriz de vecinos W; no solo como matriz binaria, sino que se puede definir cada entrada de la matriz con diversos pesos.
El estad´ıstico I de Mor´an para cada a˜no, se define como
M=
I
PI PI
j=1 (ri − r¯ )(r j − r¯ ) , PI 2 (r − r ¯ ) i i, j Wi j i=1
i=1
P
(II.8.1)
donde I es el n´umero total de municipios (en este caso 15).
Los valores del estad´ıstico I de Mor´an oscilan entre +1 y −1, donde el primer valor significa una autocorrelaci´on positiva perfecta (perfecta concentraci´on), y el segundo una autocorrelaci´on negativa perfecta (perfecta dispersi´on); el cero significa un patr´on espacial completamente aleatorio, que es lo que se espera.
Para e´ ste estad´ıstico, la hip´otesis nula es que no hay asociaci´on espacial entre los residuos versus, la hip´otesis alternativa, que si se presenta patr´on entre los mismos.
En [1] se sugiere aplicar ciertos pasos para calcular el estad´ısitico I de Mor´an para un a˜no. Como se est´a desarrollando este trabajo para un modelo espacio-temporal, se generaliza e´ sta idea para t a˜nos, present´andose a continuaci´on el algoritmo implementado en el software libre R, con el fin de ilustrar c´omo fu´e calculado dicho estad´ıstico. El algoritmo es, 1. Construir una matriz M de dimensiones k × T que contenga los residuos originales rit de cada
´ ´ CAPITULO II. MARCO TEORICO
39
a˜no t (t = 1, ...T ) y cada municipio del estado Sucre i (i = 1, ..., k). 2. Aplicar la ecuaci´on (II.8.1) a cada columna de la matr´ız M, obteni´endose as´ı el vector ~ observado, t , donde cada entrada del vector representa la I de Mor´an en cada a˜no t. M 3. Realizar r´eplicas de 1000 muestras para cada vector de la matriz M y repetir el paso 2 a fin ~ replicado, t . de obtener M ~ replicado, t , considerando 4. Identificar los cuantiles q α2 y q1− α2 para cada a˜no de las muestras de M un α peque˜no, por ejemplo α = 0.05. ~ replicado, t cae dentro de los valores del paso anterior. 5. Verificar si cada valor del vector M ~ observado, t deben estar para cada a˜no en Si no existe correlaci´on espacial entre los residuos, los M el intervalo (q α2 , q1− α2 ); en caso contrario, el modelo escogido presenta correlaci´on espacial. Para cada subconjunto de datos ~y (todos los datos exceptuando el i-´esimo vector), se ajusta el −i
modelo IV.3.1.
II.9 P-valor Bayesiano Predictivo a Posteriori Al evaluar un modelo, la pregunta pertinente no es si el modelo es verdadero o falso, ya que en la mayor´ıa de los casos ning´un modelo es totalmente correcto, a´un cuando sea u´ til en la pr´actica. La pregunta relevante ser´a, entonces, si las deficiencias del modelo tienen un impacto importante en la inferencia [6].
Una forma de verificar si el modelo se ajusta a los datos observados es realizar una validaci´on externa utilizando el modelo para hacer predicciones sobre datos futuros. Esto implica la recopilaci´on de estos datos, para poder compararlos con las predicciones ya hechas. Una opci´on es
´ ´ CAPITULO II. MARCO TEORICO
40
considerar el p-valor bayesiano predictivo a posteriori [21], el cual se define como p − valorB = p (y rep ≤ yobs )
(II.9.1)
donde y rep es el vector replica del dato observado para un a˜no y municipio en particular yobs . Se considerar´a dudoso un modelo cuando la probabilidad de la cola para alguna cantidad de prueba de inter´es est´e cercana a 0 o a 1 (menor que 0.01 o mayor 0.99). Los p-valores no deben ser interpretados como p (Modelo es verdadero|Datos). De igual forma los p-valores no deben ser interpretados como evidencia num´erica. Es decir, un p-valor de 0.00001 no es m´as fuerte en la pr´actica que 0.001. En ambos casos el aspecto de los datos medido para la cantidad de prueba es inconsistente con el modelo. El objetivo es cuantificar las discrepancias entre los datos y el modelo y as´ı determinar si estas discrepancias provienen del azar bajo las suposiciones del mismo modelo.
´ CAPITULO III ´ DE LA BASE DE CONSTRUCCION DATOS En este cap´ıtulo se presentar´a la forma en que se obtuvieron, se procesaron y depuraron los datos. Se mencionar´an las instituciones y personas que hicieron posible la construcci´on de la base de datos. Se realizar´a un an´alisis descriptivo de las variables de inter´es, donde el estudio se implementar´a por municipio en los a˜nos de estudio (1990 − 2002). Tambi´en se har´a menci´on de los paquetes estad´ısticos utilizados para el desarrollo de este an´alisis.
III.1 Obtenci´on de Datos Para este trabajo se dedic´o buena parte del tiempo en la busqueda y recolecci´on de datos epidemiol´ogicos, clim´aticos y sociales requeridos, proviniendo dichos datos de diferentes fuentes.
Los datos relacionados con las variables sociales se obtuvieron del Instituto Nacional de Estad´ıstica (INE), la informaci´on de casos de malaria en el estado Sucre fu´e aportada por el MSDS (Ministerio de Salud y Desarrollo Social), alerta malaria semanal, a trav´es de la profesora Yasmin Rubio Palis; los datos clim´aticos fueron suministrados por diferentes fuentes, como: El Centro de 41
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
42
Estad´ıstica y Software Matem´atico (CESMa) de la Universidad Sim´on Bol´ıvar, el Ministerio del Poder Popular de Agricultura y Tierras, el Ministerio Popular del Ambiente y el National Oceanic and Atmospheric Administration (NOAA); mientras que los datos de casos importados de malaria los suministr´o el Instituto de Zoolog´ıa Tropical(IZT) de la Universidad Central de Venezuela.
III.2 Procesamiento y Depuraci´on de los Datos III.2.1 Datos de Malaria Los datos de casos de malaria suministrados corresponden al per´ıodo 1990−2002. En algunos a˜nos se presentaron datos faltantes, los cuales se estimaron con el promedio de los municipios vecinos. Se procedi´o a limpiar los datos y se obtuvo el total anual de casos de paludismo por municipio para cada a˜no.
Con el fin de observar c´omo se comporta la enfermedad en dichos municipios y realizar un an´alisis descriptivo del comportamiento del vector dependiendo de los focos mal´aricos se presenta la Figura III.1.
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
43
6000
5000
1990 1991 1992
Casos de malaria
4000
1993 1994 1995
3000
1996 1997 1998
2000
1999 2000 2001 2002
1000
0
Municipios
Figura III.1: N´umero de casos de malaria en los 15 municipios del estado Sucre en el per´ıodo 1990 − 2002 Los municipios altamente mal´aricos en los a˜nos de estudio fueron Cajigal, Mari˜no y Ribero, como lo muestra la Figura III.1. En el a˜no 2002 hubo un repunte importante de casos de malaria para el estado, increment´andose en Cajigal, donde se contabilizaron 5559 casos, por tal motivo se puede considerar el municipio Cajigal como una regi´on end´emica. Otro de los municipios con un alto n´umero de casos de malaria entre 1990 − 2002 es Mari˜no el cual es reportado en [10].
Es de relevancia observar que estos dos municipios (Cajigal y Mari˜no) son vecinos (ver Figura I.2), lo cual induce a considerar un modelo bayesiano que capture la informaci´on de vecindad, e´ sto con el fin de explicar si esta cualidad influye en la propagaci´on de la enfermedad a regiones contiguas.
Una posible causa del repunte de la enfermedad en estas regiones es que el 2002 fue un a˜no con condici´on clim´atica El Ni˜no, lo que pudo alterar la producci´on del vector. Es por esta raz´on que para este trabajo es importante considerar diversas variables que puedan influir en el incremento de la enfermedad y propagaci´on del vector, como por ejemplo las variables clim´aticas.
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
44
III.2.2 Variables Sociales La base de datos del Instituto de Nacional de Estad´ıstica (INE), fue sometida a un proceso de revisi´on y ordenamiento.
Se implementaron diversas t´ecnicas para el estudio de las variables, entre ellas: Componentes principales, biplots y an´alisis de conglomerados.
La t´ecnica de Componentes Principales, (PCA), es un procedimiento matem´atico que transforma un conjunto de variables correlacionadas de respuestas en un conjunto menor de variables no correlacionadas [12], donde el inter´es se centra en representar la variabilidad de las variables originales por un n´umero menor de variables [12].
Otra t´ecnica que se aplica a las variables (sociales, clim´aticas, etc), se conoce como biplots, el cual es u´ til para describir gr´aficamente los datos o para mostrar los resultados proporcionados por modelos m´as formales. Las representaciones de las variables son normalmente vectores, y coinciden con las direcciones en las que mejor se muestra el cambio individual de cada variable.
El prefijo “bi”se refiere a la superposici´on, en la misma representaci´on, de municipios y variables.
Desde el punto de vista del usuario, los biplots ser´an importantes ya que su interpretaci´on se basa en conceptos geom´etricos sencillos. Las longitudes y los a´ ngulos de los vectores que representan a las variables, se interpretan en t´erminos de variabilidad y covariabilidad respectivamente.
Seguidamente se aplica el an´alisis de conglomerados (clusters), tambi´en conocido como m´etodo de clasificaci´on autom´atica o no supervisada, el cual tiene como objetivo agrupar elementos en grupos homog´eneos en funci´on de las similitudes entre ellos [40]. El m´etodo utilizado fu´e el
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
45
aglomerativo y el criterio de la aproximidad entre los grupos fu´e el “vecino mas cercano ”. Estos an´alisis se realizaron en el paquete estad´ıstico de software libre R.
Consider´andose el estudio de las variables sociales, e´ stas se analizan por municipios para los a˜nos disponibles en el INE (1990, 1995 y 2001), siendo e´ stos los a˜nos base para el estudio.
Estas variables se clasificaron como: Necesidades b´asicas, porcentaje de empleados y servicios b´asicos.
En cuanto a las variables relacionadas con necesidades b´asicas, con los a˜nos base 1990 y 2001 se consideraron con las siguientes caracter´ısticas: • Porcentaje de hogares pobres. • Porcentaje de personas en hogares pobres. • Porcentaje de vivienda con materiales de calidad mala. • Porcentaje de vivienda con materiales de calidad regular. • Porcentaje de hogares con hacinamiento cr´ıtico. • Porcentaje de hogares con viviendas inadecuadas. • Porcentaje de hogares con carencia de servicios. Para los a˜nos base resultaron dos componentes. Para 1990 la t´ecnica de componentes principales explic´o el 85.84% de la variabilidad de los datos, donde la primera componente (I1 ) asimila el porcentaje de viviendas con materiales de mala calidad y la segunda componente (I2 ), est´a relacionada con el porcentaje de personas en hogares pobres. Para el a˜no 2001, se seleccionaron las dos primeras componentes, con un porcentaje acumulado de variabilidad de 87.42%, donde la primera componente est´a relacionada con el porcentaje de carencias de servicios b´asicos (I3 ) y la segunda
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
46
componente (I4 ) con porcentaje de viviendas con materiales de calidad regular. En la Figura III.2 se muestran los diagramas de caja relacionados con estas variables de estudio.
Año 1990 Año 2001 80
60
40
20
%H.Care.Serv.Basic 01
%H.CareServ.Basic
%H.Viv.Inadec 01
%H.Viv.Inadec
%Hac.Critico 01
%Hac.Critico
%Viv.Calidad Reg 01
%Viv.Calidad Reg
%Viv.Mala Calidad 01
%Viv.Mala Calidad
%P.H.Pobres 01
%P.H.Pobres
%H.Pobres 01
%H.Pobres
0
Figura III.2: Boxplot de las variables de necesidades b´asicas en los a˜nos 1990 y 2001 para los 15 municipios del estado Sucre. Se observa en general, que el estado Sucre para el a˜no 2001 mejor´o notablemente su nivel socio-econ´omico (boxplot color rojo) en comparaci´on con el a˜no 1990 (boxplot color azul); tanto las variables de porcentajes de hogares pobres como porcentajes de personas en hogares pobres disminuyeron considerablemente, seguido de las variables de porcentaje de viviendas de mala calidad, hogares con viviendas inadecuadas y hacinamiento cr´ıtico.
Sin embargo, se presenta un aumento notable de carencia de servicios b´asicos y levemente el
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
47
porcentaje de viviendas de calidad regular; lo cual tiene sentido, pues al aumentar la calidad de vida de la poblaci´on, se exigen mas servicios b´asicos y mejora el tipo de vivienda.
Figura III.3: Biplot de variables de necesidades b´asicas para los 15 municipios del estado Sucre en el a˜no 1990 En la Figura III.3 se presenta el biplot de de variables de necesidades b´asicas para los 15 municipios del estado Sucre en el a˜no 1990, donde las flechas rojas corresponden a las variables que se est´an analizando, en e´ ste caso variables relacionadas con necesidades b´asicas; mientras que los nombres dispersos a lo largo de la Figura III.3 representan los municipios del estado Sucre.
Se observa en la Figura III.3 una separaci´on entre las variables en tres grupos; la variable de porcentajes de viviendas con materiales de calidad regular tiene baja correlaci´on con el resto de las
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
48
variables, al igual que la variable de porcentaje de hogares pobres, mientras que la variable de porcentaje de viviendas de calidad mala est´a altamente correlacionada con las variables de porcentaje de hogares con viviendas inadecuadas y las variables de porcentaje de hogares pobres y porcentaje de hogares con carencia de servicios.
Como se aprecia en la Figura III.3, los ejes mas importantes corresponden al porcentaje de viviendas con materiales de calidad mala (I1 ) y porcentaje de personas en hogares pobres (I2 ). El porcentaje de viviendas con materiales con calidad mala tiene un peso negativo en el primer eje y positivo en el segundo eje principal; mientras que el porcentaje de personas en hogares pobres
CruzSAcosta
Mariññnño
Bermuúdez
AndreésEBlanco
Cajigal
Bolíivar
Ribero
Beníitez
Montes
Andrééñëè÷çe÷sMata
Mejias
Arismendi
Sucre
Libertador
Valdez
15 10
Altura
20
25
presenta peso negativo en ambos ejes.
Distancia
Figura III.4: Dendograma para los 15 municipios del estado Sucre basadosen las variables de necesidades b´asicas para el a˜no 1990
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
49
En la Figura III.4 se presenta el dendograma para el a˜no 1990 con las variables de necesidades b´asicas en el a˜no 1990, donde se observan los grupos de municipios con caracter´ısticas semejantes, por ejemplo, en I1 , los municipios Mej´ıas, Montes y Andr´es Mata, poseen mayor porcentaje de viviendas con materiales de mala calidad que el resto de los municipios. I2 se presenta con mayor fuerza en Arismendi. Bol´ıvar, Ribero, Benitez y Cajigal tiene mayor poblaci´on de porcentaje con hogares pobres y hogares con carencias de servicios, mientras que los municipios Cruz Salmer´on Acosta y Andr´es Eloy Blanco presentan mayor porcentaje de viviendas con calidad regular.
Por otra parte, el municipio Andr´es Eloy Blanco presenta mayor porcentaje de hogares con hacinamiento cr´ıtico y Valdez podr´ıa ser considerado como una observaci´on at´ıpica, pues est´a muy alejado del resto de los municipios con las caracter´ısticas estudiadas.
Figura III.5: Biplot de las variables de necesidades b´asicas para el a˜no 2001 en los 15 municipios del estado Sucre.
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
50
En las Figuras III.5 y III.6 se presenta un an´alisis an´alogo al anterior pero para el a˜no 2001. En el biplot de la Figura III.5 se han representado conjuntamente las observaciones por sus proyecciones estandarizadas en el plano, mostrando que I3 , es el componente relacionado con el porcentaje de hogares con carencias b´asicas. Este componente presenta un peso negativo en ambos ejes, mientras que I4 est´a relacionado con el porcentaje de viviendas con materiales de calidad regular tiene peso positivo en el primer eje y negativo para el segundo eje. Adem´as, las variables relacionadas con pobreza est´an altamente correlacionadas con I3 y el porcentaje de viviendas con
Ribero
Montes
Bolíivar
Arismendi
Marinño
AndréesEBlanco
Libertador
Valdez
Cajigal Beniítez
AndréesMata
Mejias
Sucre
CruzSAcosta Bermuúdez
8 6 4
Altura
10
12
14
16
18
materiales de calidad mala tiene correlaci´on baja con I4 , pero no con las otras variables de estudio.
Distancia
Figura III.6: Dendograma de los municipios usando variables de necesidades b´asicas para el a˜no 2001 en los 15 municipios del estado Sucre En la Figura III.5, se obs´erva que para el a˜no 2001, los municipios Andr´es Mata y Ben´ıtez
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
51
presentan la caracter´ıstica del componente I3 , es decir, estos municipios se caracterizan por tener un alto porcentaje de carencia de servicios b´asicos; mientras que en los municipios Andr´es Eloy Blanco, Mari˜no y Libertador predominan las cualidades de porcentaje de viviendas con materiales de calidad regular. En el municipio Valdez se presenta mayor porcentaje de hogares con hacinamiento cr´ıtico y en cuanto al porcentaje de viviendas con materiales de mala calidad, los municipios que presentan mayormente esta caracter´ıstica son Ribero, Arismendi y Bol´ıvar.
Para este a˜no Sucre,Montes, Berm´udez y Cruz Salmer´on Acosta se pueden considerar como municipios at´ıpicos, pues est´an alejados del resto de los municipios.
Para incluir los componentes I1 , I2 I3 , e I4 en el modelo matem´atico se procede a construir dos matrices de pobreza, las cuales se denotar´an como X1 y X2 . Estas matrices siguen la siguiente estructura:
Para construir la matriz X1 , la cual es de dimensi´on 15 × 13 (municipios × a˜nos) se escogi´o a conveniencia la siguiente metodolog´ıa, se repite el componente I1 para el per´ıodo 1990 − 1995 y para el resto de las columnas referentes a los a˜nos 1996 − 2002 se completa con el componente I3 . Se realiza el mismo procedimiento para construir la matr´ız X2 , utilizando I2 e I4 respectivamente. Respecto a la variable de porcentaje de empleados, la clasificaci´on de los tipos de actividades fu´e la siguiente: • Agricultura. • Miner´ıa. • Manufactura. • Electricidad y Gas.
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
52
• Construcci´on. • Comercio. • Transporte. • Comunicaci´on. • Otras. Para estas variables, el m´etodo de componentes principales explica para el primer componente el 81.38% de la variabilidad de los datos, siendo la variable I5 que esta relacionada con agricultura la representante de este grupo de porcentaje de empleados. Los datos utilizados son del a˜no 1999.
Figura III.7: Biplot de las variables de tipo de empleos para los 15 municipios del estado Sucre en el a˜no 1999.
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
53
El biplot resultante para estos datos se presenta en la Figura III.7, el cual est´a relacionado con el tipo de empleos para los 15 municipios del estado Sucre en el a˜no 1999. En este biplot I5 presenta peso positivo en el primer eje y cero en el segundo eje principal.
Al realizar la comparaci´on entre las Figuras III.7 y III.8, se obtiene que los municipios Libertador, Mari˜no, Montes, Andr´es Eloy Blanco, Andr´es Mata, Cajigal, Arismendi y Ben´ıtez presentan la caracter´ıstica que son municipios agr´ıcolas, pero principalmente Libertador, Cajigal, Benitez y Mari˜no son zonas agr´ıcolas, coincidiendo e´ ste an´alisis con el an´alisis presentado por [13]. Cruz Salmer´on Acosta tiene como principal fuente de empleo la manufactura; Sucre y Berm´udez son municipios con otras caracter´ısticas diferentes a las variables expuestas y Mej´ıa y Ribero presentan mayor relaci´on con miner´ıa, electricidad, gas y agua, construcci´on, comunicaciones, comercio y transporte.
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
Montes
Libertador
Mariñno
Arismendi
AndréesEBlanco
AndreésMata
Cajigal
Beniítez
Ribero
Mejias
Valdez
Sucre
Bermúudez
CruzSAcosta
10 5 0
Altura
15
20
Bolíivar
25
30
54
Distancia
Figura III.8: Dendograma de los municipios usando variables de empleo en el a˜no 1999 para los 15 municipios del estado Sucre. El municipio Bol´ıvar se considera un municipio at´ıpico, pues esta alejado del resto de los municipios.
Las variables de estudio est´an altamente correlacionadas a excepci´on de las variables de manufactura, agricultura y otras.
Como se comenta anteriormente, s´olo se tiene informaci´on del componente I5 para el a˜no 1999. Por lo tanto, al construir la matriz X5 para el modelo matem´atico se considera el mismo vector del componente para todos los a˜nos.
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
55
En cuanto a la variable de servicios b´asicos, se incluyen las siguientes caracter´ısticas: • Acueducto. • Disposici´on de cloacas. • Categorizaci´on seg´un esfuerzo para el acondicionamiento urbano. • Recolecci´on y disposici´on de desechos s´olidos. El primer componente principal para e´ sta variable explica el 79.67% de la variabilidad de los datos, defini´endose como I6 y est´a relacionado con la disposici´on de cloacas y acueductos. Los datos aportados son para el a˜no 1995. 4
2
0
2
0.2
0.0
Mariño CruzSAcosta Comp.2
Ribero 2
AndréLibertador sEBlanco
cueducto
Montes
CategSegEsfuerzoparaelAcondUrb AbastecAgPotyDispAguServ Mejias Cajigal Arismendi Bolívar sicCloacas RecolyDispDeseSól
0
0.2
0.4
Valdez
2
Bermúdez 0.4
André Bení sMata tez
4
Sucre 0.4
0.2
0.0
0.2
0.4
Comp.1
Figura III.9: Biplot de las variables de servicios para los 15 municipios del estado Sucre en el a˜no 1995
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
56
Como se muestra en la Figura III.9, la variable acueducto tiene peso negativo en el primer eje y positivo para el segundo eje; disposici´on de cloacas tiene tambi´en peso negativo en ambas componentes y su correlaci´on no es muy alta si se compara con la correlaci´on entre la variable de
Sucre
Mariñno
CruzSAcosta
Boliívar
Arismendi
Mejias
Cajigal
Beníitez
AndréesMata
AndréesEBlanco
Libertador
Montes
Ribero
Valdez
0.5 0.0
Altura
1.0
Bermuúdez
1.5
disposici´on de cloacas y recolecci´on y disposici´on de desechos s´olidos.
Distancia
Figura III.10: Dendograma de los municipios de las variables de servicios en el a˜no 1995, para los 15 municipios del estado Sucre Comparando las Figuras III.9 y III.10, se observa que la variable acueducto predomina en los municipios Cruz Salmer´on Acosta, Mari˜no, Andr´es Eloy Blanco y Libertador; mientras que para el municipio Berm´udez est´a presente la disposici´on de cloacas y recolecci´on y disposici´on de desechos s´olidos; los municipios Mej´ıa, Cajigal, Montes, Arismendi y Bol´ıvar presentan la cararter´sitica de categorizaci´on seg´un esfuerzo para el acondicionamiento urbano y finalmente los municipios Andr´es Mata, Valdez y Ribero, se pueden considerar municipios at´ıpicos.
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
57
Este componente s´olo aporta informaci´on para un a˜no, en este caso 1995. Por tal raz´on se construye la matriz X3 de la forma como se construy´o X5 .
III.2.3 Variables Clim´aticas Para obtener los datos de precipitaci´on del estado Sucre, se realiz´o la interpolaci´on del campo de lluvia mensual de las 23 estaciones climatol´ogicas que conforman la red de estaciones disponibles en el estado, las cuales se presentan en el APENDICE A. La Figura III.11 muestra la distribuci´on y ubicaci´on geogr´afica de las 23 estaciones climatol´ogicas del estado Sucre con sus respectivas informaciones como longitud, latitud y MSNM. CARUPANO
CHACARACUAL IRAPA
TUNAPUY
GUIRIA-AERO
CASANAY CARIACO-MUECARIACO
CANGREJALALGARROBITO LAS PALOMAS HACIENDA LA
CUMANA-UDOCUMANA-AERO
CATUARO LOS CLAVELL
CANCAMURE NURUCUAL CUMANACOA-L BAJO NEGRO
COCOLLAR
50 Km
Leyenda Municipio Andres Eloy Blanco Municipio Andres Mata Municipio Arismendi Municipio Benitez Municipio Bermudez Municipio Bolívar Municipio Cajigal Municipio Cruz Salmeron Acosta Municipio Libertador Municipio Mariño Municipio Mejia Municipio Montes Municipio Ribero Municipio Sucre Municipio Valdez
Estaciones climatológicas LATITUD 10 º 28 ´ 50 ´´ 10 º 10 ´ 40 ´´ 10 º 19 ´ 20 ´´ 10 º 28 ´ 42 ´´ 10 º 30 ´ 0 ´´ 10 º 30 ´ 0 ´´ 10 º 40 ´ 0 ´´ 10 º 32 ´ 0 ´´ 10 º 22 ´ 0 ´´ 10 º 39 ´ 0 ´´ 10 º 10 ´ 58 ´´ 10 º 27 ´ 0 ´´ 10 º 27 ´ 0 ´´ 10 º 15 ´ 0 ´´ 10 º 35 ´ 0 ´´ 10 º 36 ´ 0 ´´ 10 º 25 ´ 45 ´´ 10 º 20 ´ 0 ´´ 10 º 27 ´ 0 ´´ 10 º 17 ´ 0 ´´ 10 º 42 ´ 0 ´´ 10 º 20 ´ 32 ´´ 10 º 34 ´ 40 ´´
LONGITUD MSNM 63 º 12 ´ 20 ´´ 154 64 º 19 ´ 50 ´´ 230 64 º 12 ´ 8 ´´ 93 63 º 19 ´ 30 ´´ 142 63 º 36 ´ 0 ´´ 12 63 º 40 ´ 0 ´´ 10 63 º 15 ´ 0 ´´ 20 63 º 25 ´ 15 ´´ 72 63 º 29 ´ 30 ´´ 462 63 º 1 ´ 20 ´´ 74 63 º 48 ´ 57 ´´ 834 64 º 7 ´ 0 ´´ 2 64 º 11 ´ 0 ´´ 2 63 º 55 ´ 54 ´´ 234 62 º 19 ´ 0 ´´ 13 62 º 42 ´ 0 ´´ 51 63 º 29 ´ 0 ´´ 0 63 º 38 ´ 0 ´´ 313 63 º 11 ´ 0 ´´ 209 64 º 22 ´ 42 ´´ 16 63 º 7 ´ 0 ´´ 80 64 º 2 ´ 15 ´´ 120 63 º 6 ´ 22 ´´ 53
ESTACIÓN ALGARROBITO BAJO NEGRO CANCUMARE CANGREJAL CARIACO CARIACO MUELLE CARUPANO CASANAY CATUARO CHACARACUAL COCOLLAR CUMANA AEROPUERTO CUMANA UDO CUMANACOA LA GRANJA GUIRIA AEROPUERTO IRAPA LA HACIENDA LAS CLAVELLINAS LAS PALOMAS NURUCUAL RIO CARIBE SALSIPUEDES TUNAPUY
Figura III.11: Distribuci´on de las 23 estaciones climatol´ogicas en el estado Sucre. Se realizaron algunos an´alisis previos a la interpolaci´on del campo de lluvia, como: la agrupaci´on de estaciones en grupos de reg´ımenes semejantes usando el m´etodo de las k-medias; la completaci´on de datos faltantes seg´un la necesidad (agrupamiento en zonas geogr´aficas o´ imputaci´on mediante m´etodo bayesiano) y finalmente la aplicaci´on del m´etodo de interpolaci´on por kriging
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
58
bayesiano. El desarrollo te´orico de e´ stos an´alisis se presentan en el APENDICE A.
Se establece X9 como la variable del m´aximo de la precipitaci´on en cada municipio y a˜no del estado Sucre. Esta variable se considera importante para el estudio del modelo, pues influye significativamente en la proliferaci´on del mosquito y la enfermedad seg´un estudios previos desarrollados por diversos autores [36, 41, 42].
III.2.4 Casos de Malaria Importados Otra variable que se considera para el an´alisis de casos de malaria pero no para el ajuste del modelo debido a la estructura de los datos son los casos importados de malaria desde otras regiones al estado Sucre. Esta informaci´on fu´e suministrada por el MSDS del estdo Sucre a trav´es de la profesora Laura Delgado del Instituto de Zoolog´ıa Tropical (IZT) de la Universidad Central de Venezuela.
Mapa de casos importados de Malaria al Estado Sucre En Venezuela 1987 - 1999
N 0.054795 2.246575 0.493151
1.041096
0.164384
6.684932
200
100
0
200
400 Km.
E E ss cc aa ll aa G G rr aa ff ii cc aa
88.438356 0.876712
Leyenda Estados no importadores Estados Importadores Area proporcional de casos exportados al Edo. Sucre
Figura III.12: Casos importados de malaria al estado Sucre para 1989-1999
´ ´ DE LA BASE DE DATOS CAPITULO III. CONSTRUCCION
59
Como se presenta en la Figura III.12, los datos suministrados presentan la interacci´on de ocho de los veintitr´es estados que conforman el pa´ıs con el municipio Sucre. Estos estados son: Apure, Amazonas, Anzoategui, Delta Amacuro, Bol´ıvar, Miranda, Monagas y Tachira, los cuales se presentan en el mapa de color verde claro y los estados que no presentan informaci´on se muestran de color verde oscuro.
El estado que aporta mayor n´umero de casos de malaria para el estado Sucre con un 88, 43% del total de los casos importados es el estado Bol´ıvar, seguido de Apure, con 6, 68% y Monagas con 2, 24% de casos. El resto de los estados aportan menos del 1%.
´ CAPITULO IV RESULTADOS En este cap´ıtulo se presentar´an los resultados obtenidos de ajustar bayesianamente los modelos considerando los criterios DIC y D ; as´ı como tambi´en la selecci´on del mejor modelo y la estructura desarrollada con el paquete estad´ıstico de software libre WinBugs del modelo seleccionado. Se presentar´a los ajustes de los modelo mediante el p − bayesiano; las tablas de estudio por municipio del comportamiento de los riesgos de contraer la enfermedad, el riesgo relativo, la mediana y los intervalos de predicci´on del modelo ajustado.
IV.1 Variables Explicativas Las variables explicativas presentadas en el CAP´ITULO III, llevan las siguientes etiquetas en los modelos estudiados • X1 : Porcentaje de viviendas con materiales de mala calidad y carencia de servicios b´asicos. • X2 : Porcentaje de personas en hogares pobres y viviendas con materiales de calidad regular. • X3 : Disposici´on de cloacas y acueductos. • X5 : Agricultura. 60
´ CAPITULO IV. RESULTADOS
61
• X9 : M´aximo de precipitaci´on. Para ajustar los modelos, se centraron las variables explicativas con el fin de disminuir los problemas de convergencia de las cadenas MCMC. Adem´as, se implement´o en el c´odigo ciertas transformaciones para los par´ametros τht y τbt con el fin de mejorar la convergencia de las cadenas simuladas; pero dichas modificaciones no aportaron gran mejor´ıa en la convergencia de las cadenas, por lo que se considerar´o utilizar las distribuciones a priori presentadas en (II.5.4).
Los modelos de la Tabla IV.1 son los riesgos relativos seg´un las ecuaciones (II.5.2) y (II.5.3). Para ambos casos se ajust´o el modelo con el mismo grupo de variables explicativas.
Para los modelos mostrados en la Tabla IV.1, se consider´o desechar las primeras 4000 iteraciones y luego simular 14000 m´as para calcular los valores de los criterios de comparaci´on y para monitorear el comportamiento de las trayectorias de las cadenas resultantes.
Estudios realizados previamente por algunos autores como [36, 41, 42, 13] consideran que el clima y la pobreza son variables importante al momento de la propagaci´on de la enfermedad, por tal motivo, se considera que el modelo espacio-temporal incluya estas variables como prioridad en el desarrollo del modelo.
Para mejorar la convergencia de las cadenas se estimaron los par´ametros αt y βt mediante el ajuste de modelos lineales generalizados (GLM) para ser usados como valores iniciales en los codigos implementados.
IV.2 Comparaci´on de los Modelos Ajustados En la Tabla IV.1 se presentan los modelos para el riesgo relativo que se consideraron, as´ı como los resultados de los criterios de DIC [19] y D [51] estimados para los modelos ajustados, donde se
´ CAPITULO IV. RESULTADOS
62
incluyen los modelos sencillos (sin CAR) y los modelos complejos (con CAR).
En la Tabla IV.1, los modelos se presentan con el argumento (+bit ), esto es: si el modelo es sencillo (sin CAR), solo se considera la estructura del riesgo relativo de la ecuaci´on II.5.2 y si el modelo es complejo (con CAR), se a˜nade el argumento (+bit ), lo cual hace que se comporte como la ecuaci´on II.5.3. Esto se hace con la finalidad de presentar la Tabla IV.1 lo mas completa posible. Tabla IV.1: Comparaci´on del ajuste de los modelos sencillos (sin CAR) y complejos (con CAR) con los criterios de DIC y D MODELOS
SIN CAR
CAR
DIC
D
DIC
D
exp(αt + β2t X2it + β9t X9it + vit (+bit ))
1689,13
517864552
1702,6
175950,2
exp(αt + β1t X1it + β9t X9it + vit (+bit ))
1688,43
518837418
1708,5
181948,3
exp(αt + β5t X5it + β9t X9it + vit (+bit ))
1690,15
518740948
1709,33
519349285
exp(αt + β3t X3it + β9t X9it + vit (+bit ))
1689,31
519983456
1707,53
178300,8
exp(αt + β2t X2it + β5t X5it + β9t X9it + vit (+bit ))
1690,91
520433771
1704,99
177759,8
exp(αt + β1t X1it + β2t X2it + β5t X5it + β9t X9it + vit (+bit ))
1690,16
518936237
1701,94
174430,4
exp(αt + β1t X1it + β2t X2it + β9t X9it + vit (+bit ))
1688,63
837149929
1706,28
179240,2
exp(αt + β1t X1it + β5t X5it + β9t X9it + vit (+bit ))
1691,31
518684859
1718,2
183262,4
exp(αt + β3t X3it + β5t X5it + β9t X9it + vit (+bit ))
1691,762
5178585516
1716,52
184213,4
Se observa en la Tabla IV.1 que el criterio DIC es de poca ayuda para elegir el mejor modelo, manteni´endose casi inalterado para la mayor´ıa de los modelos ajustados, es por ello que se procede a hacer la comparaci´on con el criterio D [19], el cual marca una mayor diferencia en los modelos ajustados.
IV.3 Modelo Elegido El modelo escogido se presenta de color amarillo en la Tabla IV.1, esto es, el modelo completo con CAR, donde se consideran las variables X1 , X2 , X5 y X9 , es decir Ψit = exp(αt + β1t · X1 it + β2t · X2 it + β5t · X5 it + β9t · X9 it + vit + bit ).
(IV.3.1)
´ CAPITULO IV. RESULTADOS
63
En la Figura IV.1 se presenta el diagrama de relaci´on entre los par´ametros del modelo que se us´o para la implementaci´on en WinBugs. A dicho diagrama tambi´en se le conoce como Doodle y se presenta en el APENDICE B.0.7.
taub[t]
X2[i,t] beta2[t]
tauv[t]
v[i,t]
b[i,t]
beta9[t]
beta5[t] X1[i,t]
mu[i,t] X9[i,t]
beta1[t] E[i,t] y[i,t]
X5[i,t]
f or(i IN 1 : N) f or(t IN 1 : T)
Figura IV.1: Doodle del modelo escogido. Esta representaci´on ayuda a entender de una manera gr´afica la estructura del programa. El Doodle consta de 3 elementos: los nodos, los platos y los bordes. Los nodos est´an representados por la forma elipsoidal o rectangular y pueden ser a su vez de 3 tipos diferentes:
• Nodos estoc´asticos, las cuales son variables que se tienen de una distribuci´on de probabilidad. Estos nodos pueden ser observados, en cuyo caso se incluir´an los datos, o pueden ser cantidades desconocidas, observaciones o datos que faltan y por tanto, son tratados como par´ametros (elipsoidal).
´ CAPITULO IV. RESULTADOS
64
• Nodos constantes, las cuales son cantidades fijas y deben ser especificadas en el archivo de datos (rectangular). • Nodos l´ogicos, son funciones l´ogicas de nodos estoc´asticos y/o constantes (elipsoidal). Los nodos constantes son representados en el Doodle mediante rect´angulos, mientras que los estoc´asticos y l´ogicos son de forma elipsoidal. Los bordes son los v´ınculos entre los nodos y pueden ser de dos tipos. Una flecha s´olida (−→) indica dependencia estoc´astica, mientras que una flecha hueca (=⇒) indica una funci´on l´ogica.
Los platos son empleados para representar repeticiones (o lazos) de las partes del c´odigo. Para conocer m´as de la estructura de e´sta herramienta se sugiere revisar [30]. Se presenta a continuaci´on algunos resultados de la convergencia de dos cadenas obtenidas mediante el programa WinBugs. Para ello se monitore´o el comportamiento de las trayectorias de las cadenas resultantes. Algunas muestras del comportamiento t´ıpico de las cadenas obtenidas se presentan en la Figura IV.2, donde se muestran 4 ejemplos de convergencia de 2 cadenas (color rojo y azul) para diversos a˜nos. A partir de 18000 iteraciones ya se ha alcanzado la convergencia de las cadenas para los par´ametros de inter´es; en este caso se presenta para la primera franja de la cadena la convergencia del par´ametro β1 para el a˜no 1990, la segunda y tercera franja de la Figura IV.2, corresponde a β2 y β5 para el a˜no 1994, mientras que la u´ ltima franja corresponde a β9 para el a˜no 1990. Es de notar que la escala en las diferentes cadenas var´ıa, esto es debido a que las variables est´an centradas pero no divididas entre su varianza.
´ CAPITULO IV. RESULTADOS
65
β1[1990] chains 1:2 0.1 0.05 0 -0.05 -0.1 -0.15 18000
18500
19000
19500
20000
19500
20000
19500
20000
19500
20000
iterati on β2[1994] chains 1:2 0.2 0.1 0.0 -0.1 18000
18500
19000 iterati on
β5[1994] chains 1:2 0.15 0.1 0.05 0.0 -0.05 18000
18500
19000 iterati on
β9[1991] chains 1:2 15.0 10.0 5.0 0.0 18000
18500
19000 iterati on
Figura IV.2: Cadenas de convergencia de los par´ametros β1 , β2 , β5 , β9 para algunos a˜nos de estudio. Como el modelo seleccionado IV.3.1 incluye el componente CAR, es conveniente graficar la mediana de este par´ametro de estudio para apreciar su influencia en el riesgo relativo de cada mu-
´ CAPITULO IV. RESULTADOS
66
nicipio. En la Figura IV.3 se presenta para los 13 a˜nos el aporte del componete CAR. Se considera la mediana como medida de comparaci´on para estudiar el comportamiento de dicho componente.
Se observa en la Figura IV.3 que los municipios con mayor efecto CAR (mayores a 0) corresponden a los municipios con mayor riesgo relativo (ver la Figura II.1). Esto muestra que se est´a a˜nadiendo buena parte del riesgo relativo a un efecto aleatorio no explicado por las covariables.
´ CAPITULO IV. RESULTADOS
67
Año 1990
Año 1991
Año 1992
Año 1993
Año 1994
Año 1995
Año 1996
Año 1997
Año 1999 Año 1998
Año 2000
Año 2001
Barbados Grenada
Aruba
Año 2002
Venezuela
100 Suriname
Menores o iguales a 0
Km
Guyana
Colombia
Es cala Gráfica
Mayores a 0
1:3.100.000
Brazil
N SS ii tt uu aa cc ii óó nn R R ee ll aa tt ii vv aa N N aa cc ii oo nn aa ll dd ee ll ee ss tt aa dd oo SS uu cc rr ee
Figura IV.3: Mediana del componente CAR para cada municipio del estado Sucre en los a˜nos 1990 − 2002.
´ CAPITULO IV. RESULTADOS
68
IV.4 Comportamiento de los Residuos Para estudiar el comportamiento de los residuos para el per´ıodo 1990 − 2002 se procedi´o a graficar los residuos obtenidos en base a N muestras de las distribuciones a posteriori de los par´ametros del modelo IV.3.1, esto es, N 1 X (n) (n) (n) (n) (n) (n) (n) α +β .X +β .X +β .X +β .X +v +b e t 1t 1 it 2t 2 it 5t 5 it 9t 9 it it it . rit = yit − Eit N n=1
(IV.4.1)
Los mapas resultantes de los residuos estimados para el modelo IV.3.1 se presentan en la Figura IV.4, donde se observa cierta dependencia de residuos para el a˜no 2002, presentandose mayor c´umulo de residuos del mismo signo, lo que en apariencia explica que en algunos municipios puede ser sobrestimado el riesgo relativo. El municipio Mari˜no en los a˜nos 1990, 1992, 1993, 1994 y 2000 tambi´en parecen presentar algo de sobre-estimaci´on.
Si el modelo se ajusta adecuadamente al riesgo relativo crudo, los residuos presentados en la Figura IV.4 deben ser independientes, es por eso que se procede a calcular el estad´ıstico I de Mor´an. Para los 13 a˜nos de estudio con el fin de verificar si se satisface la hip´otesis de independencia de residuos, para ello se implement´o en el software libre R el algoritmo de la secci´on II.8, donde se obtuvo que para todos los a˜nos hay independencia de residuos, como se observa en la Tabla IV.2, pues todos los valores del estad´ıstico I de Mor´an pertenecen al intervalo de probabilidad respectivo.
´ CAPITULO IV. RESULTADOS
69
Año 1990
Año 1991
Año 1992
Año 1993
Año 1994
Año 1995
Año 1996
Año 1997
Año 1999 Año 1998
Año 2000
Año 2001
Barbados Grenada
Aruba
Año 2002
Venezuela
100 Suriname
Menores a -1
Km
Guyana
Colombia
Es cala Gráfica
Entre -1 y 0
1:3.100.000
N Brazil
Entre 0 y 1 Mayores a 1
SS ii tt uu aa cc ii óó nn R R ee ll aa tt ii vv aa N N aa cc ii oo nn aa ll dd ee ll ee ss tt aa dd oo SS uu cc rr ee
Figura IV.4: Residuos estimados para el modelo seleccionado
´ CAPITULO IV. RESULTADOS
70
Tabla IV.2: Estad´ıstico I de Mor´an e intervalo de probabilidad calculado por a˜no para el estado Sucre. A˜no
2.50%
9.75%
I de Mor´an
1990
-0.371
0.282
-0.137
1991
-0.384
0.235
-0.249
1992
-0.380
0.300
-0.079
1993
-0.365
0.304
-0.222
1994
-0.362
0.309
-0.009
1995
-0.369
0.289
-0.076
1996
-0.367
0.296
0.034
1997
-0.399
0.329
-0.224
1998
-0.371
0.271
0.024
1999
-0.369
0.278
-0.122
2000
-0.373
0.294
-0.224
2001
-0.361
0.305
-0.024
2002
-0.337
0.204
-0.114
IV.5 Verificaci´on del Modelo Escogido El chequeo predictivo posterior verifica si el modelo es consistente con los datos. La t´ecnica b´asica consiste en simular muestras de la distribuci´on predictiva posterior y comparar estas muestras de datos replicados con los datos observados. Es muy u´ til hacer comparaciones gr´aficas de res´umenes de los datos con res´umenes de las simulaciones de la distribuci´on predictiva posterior. Cualquier diferencia sistem´atica entre las simulaciones y los datos indica que el modelo puede tener fallas [6]. En nuestro caso se simularon de los valores a posteriori 2000 replicas y se verific´o para cada a˜no si el modelo se ajustaba a los datos observados, utilizando el criterio del p − bayesiano, pre-
´ CAPITULO IV. RESULTADOS
71
sentado en la secci´on II.9.
Las Figuras IV.5-IV.18 corresponden al chequeo predictivo posterior de los 15 municipios del estado Sucre para cada a˜no de estudio (1990−2002). En cada figura se presenta un a˜no en particular, donde para cada municipio se grafica el histograma de los valores replicados de la simulaci´on de la distribuci´on a posteriori y el dato observado (l´ınea vertical de color azul). Adem´as que en la parte inferior de cada histograma se muestra el p-valor (II.9.1). Para explicar de una forma mas simple las Figuras IV.5-IV.18, se presenta a continuaci´on la Tabla IV.3 en la cual se designa cada municipio con la siguiente numeraci´on Tabla IV.3: Identificaci´on de Municipios respecto a las Figuras IV.5-IV.18 Etiqueta
Nombre del Municipio
Etiqueta
Nombre del Municipio
Municipio 1
Andr´es Eloy Blanco
Municipio 9
Libertador
Municipio 2
Andr´es Mata
Municipio 10
Mari˜no
Municipio 3
Arismendi
Municipio 11
Mej´ıa
Municipio 4
Benitez
Municipio 12
Montes
Municipio 5
Berm´udez
Municipio 13
Ribero
Municipio 6
Bol´ıvar
Municipio 14
Sucre
Municipio 7
Cajigal
Municipio 15
Valdez
Municipio 8
C. Salmer´on Acosta
Como resultado se obtiene que el modelo IV.3.1 se ajust´o mediante el criterio del p-bayesiano en casi un 99% de las pruebas realizadas a los 15 municipios en los 13 a˜nos de estudio.
´ CAPITULO IV. RESULTADOS Municipio 2
Municipio 3
Municipio 4
Municipio 5
20
p= 0.47
180
240
p= 0.517
300 0
100
Frecuencia
400 0
400 0
200
200
Frecuencia
400
Municipio 10
0 120
250
p= 0.519
160
350 450 550
p= 0.518
p= 0.539
Municipio 15
400 0
200
Frecuencia
300
600
Municipio 14
0
0
10
60 100
Frecuencia
300
Frecuencia
400
0
200
Frecuencia 20
Municipio 13
0
200
10
p= 0.563
Municipio 12
150
Municipio 9
Frecuencia
400
0
p= 0.534
Frecuencia
300 100 0
200
800
100 p= 0.534
0
p= 0.524
p= 0.519
60
Municipio 8
Frecuencia
300
Frecuencia
0 100
300
Frecuencia
100 0
650
Municipio 11
250
p= 0.524
Municipio 7
140 200 260
Frecuencia
150
p= 0.529
Municipio 6
140 200 260
300
Frecuencia
0 140 200 260
100
250
p= 0.534
100
150
100
300
Frecuencia
0
100
300 100 0
Frecuencia
600
Municipio 1
72
150
250
p= 0.527
0
20
40
p= 0.517
Figura IV.5: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1990 y p-valor En la Figura IV.5 se observa que el modelo se ajusta a los datos para e´ ste a˜no, pues todos los valores observados coinciden perfectamente a las distribuciones predictivas, ya que los p-valores bayesianos se encuentran alrededor de 0.5.
´ CAPITULO IV. RESULTADOS
450
650
550
800
400 0
200
Frecuencia
350
Municipio 5
0
150
Frecuencia
400
Municipio 4
0
200
Frecuencia
200
120
200
350
20
80
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
400
1800
2300
Frecuencia
0
6 12
0
0
200
Frecuencia
0 400
Frecuencia
0 200
Frecuencia
150 250
200
p= 0.506
400
p= 0.527
1000
p= 0.501
500
p= 0.513
300
p= 0.55
0
150
450 650
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
p= 0.527
0 15
550
800
p= 0.496
p= 0.515
0
200
Frecuencia
0
200
Frecuencia
200 0
0
200 0 150
500
p= 0.503
500
p= 0.53
400
p= 0.542
Frecuencia
p= 0.492
Frecuencia
p= 0.506
200
Frecuencia
40
Frecuencia
Municipio 3
0
300
Frecuencia
600
Municipio 2
0
Frecuencia
Municipio 1
73
2400 p= 0.528
80
160
p= 0.527
Figura IV.6: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1991 y p-valor. Para 1991 tambi´en se observa un buen ajuste en el modelo para los 15 municipios del estado Sucre, en e´ ste caso como en el anterior, el p-valor oscila en 0.5 aproximadamente.
´ CAPITULO IV. RESULTADOS
0
400
Municipio 5 Frecuencia
500 0 200
Frecuencia
0
200
Frecuencia
300 150
Municipio 4
p= 0.513
p= 0.515
p= 0.505
p= 0.487
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
30
0 200
Frecuencia
200 0
0
Frecuencia
Frecuencia
0 200
200 p= 0.557
p= 0.511
p= 0.537
p= 0.543
p= 0.544
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
60
p= 0.557
100
200
p= 0.515
150
200 0
0
Frecuencia
Frecuencia
0
150
Frecuencia
200 0
200 0 20
400
300 450
200 400
20 60
350
100 200
400
300
Frecuencia
260
0
500
p= 0.506
140
120
400
40
200 400
80 160
500
250
Frecuencia
60
0
Frecuencia
20
Frecuencia
Municipio 3
0
Frecuencia
200 400
Municipio 2
0
Frecuencia
Municipio 1
74
300
120 220
20
80
p= 0.525
p= 0.515
p= 0.497
Figura IV.7: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1992 y p-valor. En la figura IV.7, se presentan las mismas caracter´ısticas a los dos a˜nos anteriores, un buen ajuste del modelo IV.3.1 para los 15 municipios, es decir, los valores observados se ajustan adecuadamente al modelo escogido.
´ CAPITULO IV. RESULTADOS
40
100
10
60
600 300 0
200
Frecuencia
Municipio 5
0
200
Frecuencia
400
Municipio 4
0
Frecuencia
150 300
15
20
80
0
30
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10 Frecuencia
p= 0.569
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
p= 0.574
0
30
p= 0.571
40
100
300 0
200 0
0
Frecuencia
Frecuencia
0
200
Frecuencia
200 p= 0.442
50
15
700
p= 0.483
10
0
Frecuencia
p= 0.568
10
50
300 600
p= 0.528
500
p= 0.664
0
10
0
0
200
Frecuencia
0
200
Frecuencia
200 0
400
20
500
0 20
0
80
150 300
p= 0.579
500
p= 0.494
500
p= 0.519
400
p= 0.595
Frecuencia
p= 0.432
0
Frecuencia
0
Frecuencia
Municipio 3
0
Frecuencia
400 800
Municipio 2
0
Frecuencia
Municipio 1
75
20 60
0 20
p= 0.486
p= 0.585
Figura IV.8: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1993 y p-valor. Se observa tambi´en en los a˜nos 1993 y 1994 (Figuras IV.8 y IV.9) el ajuste de las distribuciones predictivas para el modelo, obteni´endose un p-valor alrededor del 0.5.
´ CAPITULO IV. RESULTADOS
100
10
500 200 0
0 200
50
Municipio 5 Frecuencia
500
Municipio 4 Frecuencia
500 0 200
Frecuencia
400 200
50
250
400
20
60
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
15
20
80
40
100
300 0
0
Frecuencia
Frecuencia
150 0
0
200
Frecuencia
200 0
600
p= 0.599
400 800
p= 0.518
350
p= 0.471
Frecuencia
p= 0.53
500
p= 0.51
0
0
15
60 120
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
40 100
80
160
p= 0.567
p= 0.531
p= 0.538
0
200
Frecuencia
0
300
Frecuencia
0
0
200
Frecuencia
Frecuencia
150 0 0 15
500
p= 0.574
600
p= 0.448
500
p= 0.58
300
p= 0.517
350
p= 0.601
150
Frecuencia
10
Frecuencia
Municipio 3
0
200
Frecuencia
500
Municipio 2
0
Frecuencia
Municipio 1
76
0
30
p= 0.509
10
50
p= 0.534
Figura IV.9: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1994 y p-valor.
´ CAPITULO IV. RESULTADOS
500
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
350
60
140
15
200 0
0
200
Frecuencia
0
200
Frecuencia
150 0 200
0
400
p= 0.593
Frecuencia
1300
Frecuencia
p= 0.515
15
160
500
p= 0.525
350
p= 0.51
500
p= 0.532
200
80
0 200
0
Frecuencia
300 600
Frecuencia
500 200 0
Frecuencia
200 400
Municipio 5
450 650
0
20
70
120
240
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
p= 0.549
0 15 p= 0.463
400
600
p= 0.527
0
400
Frecuencia
0
200
Frecuencia
0
0 240
200
Frecuencia
Frecuencia
200 0 120
1000
p= 0.52
400
p= 0.538
500
p= 0.528
400
p= 0.517
400
p= 0.638
200
Frecuencia
Municipio 4
250 400
0
Frecuencia
Municipio 3
0
300
Frecuencia
600
Municipio 2
0
Frecuencia
Municipio 1
77
20
70
p= 0.535
0 10 p= 0.502
Figura IV.10: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1995 y p-valor Para 1995 y 1996 al igual que en los a˜nos anteriores se observa un ajuste perfecto en los municipios del estado Sucre, esto se verifica mediante el chequeo predictivo de los p-valores bayesianos de las Figuras IV.10 y IV.11, donde el p-valor var´ıa como en los a˜nos anteriores en 0.5 respectivamente.
´ CAPITULO IV. RESULTADOS
550
650
900
0
200
Frecuencia
Municipio 5
0
200
Frecuencia
400
Municipio 4
0
200
Frecuencia
500 200 350
850
1150
40
100
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
70
650
900
150 0
0
200
Frecuencia
0
400
Frecuencia
0
200
Frecuencia
200 20
350
p= 0.519
Frecuencia
p= 0.488
800
p= 0.506
400
p= 0.511
400
p= 0.518
0
0 10
80
180
200
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
70
p= 0.513
300 450 p= 0.502
550
800
p= 0.513
300 0
Frecuencia
0
0
Frecuencia
Frecuencia
Frecuencia
200 0 20
600
p= 0.505
150 300
p= 0.531
200 400
p= 0.407
500
p= 0.517
400
p= 0.534
0 200
Frecuencia
400
Frecuencia
Municipio 3
0
200
Frecuencia
500
Municipio 2
0
Frecuencia
Municipio 1
78
200
0
30
p= 0.553
p= 0.508
Figura IV.11: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1996 y p-valor
´ CAPITULO IV. RESULTADOS
0
300000
0
1500
0
1000
Frecuencia
1400
Municipio 5
0
600
Frecuencia
1400
Municipio 4
0
600
Frecuencia
1000
5000
0e+00
0
15000
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
50000
0
4000
0
15000
0 200
Frecuencia
0
0
1000
Frecuencia
400 0
1000 0
500
p= 0.72
600 1200
p= 0.044
Frecuencia
p= 0.959
1000
p= 0.26
Frecuencia
p= 0.927
0
0 15
0
2500
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
0
4000
p= 0.139
p= 0.179
0
600 p= 1
0
1000 0
1000 0
0
1000 0 0 60000
1000
p= 0.628
Frecuencia
p= 1
Frecuencia
p= 0
Frecuencia
p= 0.953
Frecuencia
p= 0.252
1000
Frecuencia
0
Frecuencia
Municipio 3
0
1000
Frecuencia
Municipio 2
0
Frecuencia
Municipio 1
79
0
250000
p= 0.696
0
150000
p= 0.169
Figura IV.12: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1997 y p-valor En el a˜no 1997 se presenta un caso distinto a los anteriores, pues el modelo parece no ajustarse adecuadamente para todos los municipios. Solo se muestra un buen ajuste para 8 de los 15 municipios, estos son: Andr´es Mata, Bermudez, Bol´ıvar, Mari˜no, Mej´ıa, Montes, Sucre y Valdez.
Se observa que el modelo se subestima para 5 de los municipios, e´ stos son: Andr´es Eloy Blanco, Arismendi, Cajigal, Libertador y Ribero; mientras que para 2 de los 15 municipios el modelo
´ CAPITULO IV. RESULTADOS
80
sobrestima en Ben´ıtez y Cruz Salmer´on Acosta.
IV.5.1 Caso Especial Como el a˜no 1997 no presenta un ajuste satisfactorio del modelo IV.3.1, para los datos observados se procede a considerar para el par´ametro de heterogeneidad v una distribuci´on de colas pesadas, en este caso se considera una distribuci´on t − student con 2 grados de libertad. Se considera este valor pues deseamos una distribuci´on donde en las colas sean lo mas “pesadas” (gruesas), e´ sto con el fin de asegurar que el par´ametro v[i] pueda capturar la heterogeniedad en el modelo. El c´odigo implementado para este modelo se muestra en el APENDICE B.0.8. Para cada municipio i en el a˜no 1997 v[i] ∼ t − student(1, ξ, 2) ξ ∼ Gamma(0.5, 0.005), para la precisi´on de v[i] se considera una distribuci´on Gamma
(IV.5.1)
´ CAPITULO IV. RESULTADOS
0
750 1050
0
0
300
Municipio 5 Frecuencia
400 800 0
150 0
2500
Municipio 4 Frecuencia
350
Municipio 3 Frecuencia
400 0
600
4000
0
1500
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
p= 0.48
0
15
p= 0.541
0
300 0
1000
p= 0.531
p= 0.517
Municipio 13
Municipio 14
Municipio 15
500 p= 0.491
150 0
1000 0
2000
350
p= 0.635
Frecuencia
0
0
Frecuencia
Frecuencia 500
100 600
Frecuencia
Municipio 12
15
200
Municipio 11
0
0
p= 0.483
0
8000
0 400 1000
p= 0.553
0
Frecuencia
300 0
Frecuencia
200 0
0
300 600
60 140
300
p= 0.518
Frecuencia
p= 0.484
Frecuencia
p= 0.516
700
p= 0.489
500
p= 0.531
0
Frecuencia
200
Frecuencia
Municipio 2 Frecuencia
300 600 0
Frecuencia
Municipio 1
81
8000
40 100
p= 0.517
p= 0.484
Figura IV.13: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1997 con distribuciones de colas pesadas para el par´ametro v En la Figura IV.13 se observa el chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1997 con distribuciones de colas pesadas para el par´ametro v. Al ajustar la distribuci´on con las caracter´ısticas de (IV.5.1) en el modelo para el a˜no 1997 se observa que hay un buen ajuste en todos los municipios del estado Sucre, particularmente en Andr´es Eloy Blanco, Arismendi, Benitez, Cajigal, Cruz Salmer´on Acosta, Libertador y Ribero, los cuales eran los municipios que no presentaban un p-valor mayor a 0.01 y menor a 0.99. Para los municipios Andr´es
´ CAPITULO IV. RESULTADOS
82
Mata, Bermudez, Bol´ıvar, Mari˜no, Mej´ıa, Montes, Sucre y Valdez el p-valor en la mayor´ıa de las veces aument´o hasta el doble del valor que presentaban con el ajuste del modelo IV.3.1, disminuyendo poco en el resto de los municipios; pero siempre el p-valor siempre se presenta en el intervalo (0.01, 0.99).
100
200
750
1050
400 0
200
Frecuencia
500
Municipio 5
0
200
Frecuencia
Municipio 4
0
200
Frecuencia
500 200
200
350
550
120
220
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
40
1700
2200
0
0
200
Frecuencia
0
200
Frecuencia
0 200
Frecuencia 10
200
p= 0.532
Frecuencia
p= 0.511
500
p= 0.503
500
p= 0.467
300 600
p= 0.468
0
350 500
200
500 700
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
30
p= 0.514
300
500
p= 0.541
400
600
p= 0.552
200 0
200 0
0
200
Frecuencia
Frecuencia
300 0 0
400
p= 0.501
Frecuencia
p= 0.52
Frecuencia
p= 0.539
500
p= 0.522
600
p= 0.541
0 200
Frecuencia
100
Frecuencia
Municipio 3
0
200
Frecuencia
Municipio 2
0
Frecuencia
Municipio 1
140
260
p= 0.482
100
220
p= 0.54
Figura IV.14: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1998 y p-valor La Figura IV.14 presenta el ajuste de las distribuciones predictivas a posteriori y los p-valores
´ CAPITULO IV. RESULTADOS
83
para los 15 municipios que conforman el estado Sucre para el a˜no 1998. Como se observa para este a˜no el p-valor predictivo a posterior es aproximadamente de 0.5 lo que lleva a confirmar que para 1998 el modelo se ajusta adecuadamente a los datos.
250
800 1050
0
200
Frecuencia
500
Municipio 5
0
200
Frecuencia
0
200
Frecuencia
600 300
120
Municipio 4
350
550
200
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
1700
0 6
14
0
150
Frecuencia
0
200
Frecuencia
0
400
Frecuencia
300 0
Frecuencia
0
6
350
p= 0.507
500
p= 0.513
1000
p= 0.51
600
p= 0.522
600 1200
p= 0.507
0
300 450
950
1250
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
30
p= 0.544
400
600
p= 0.487
600
850
p= 0.529
200 0
Frecuencia
0
Frecuencia
0
200 0
Frecuencia 0
500
p= 0.52
150 300
p= 0.543
200 400
p= 0.49
Frecuencia
p= 0.498
300 600
p= 0.601
0
Frecuencia
Municipio 3
0 40
Frecuencia
Municipio 2 Frecuencia
500 0 200
Frecuencia
Municipio 1
200
350
p= 0.511
450
650
p= 0.521
Figura IV.15: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 1999 y p-valor El ajuste de los datos para el resto de los a˜nos 1999 − 2002 presentan las mismas caracter´ısticas, un buen ajuste para los datos, ya que el p-valor es aproximadamente de 0.5 la mayor´ıa de los
´ CAPITULO IV. RESULTADOS
84
municipios. Esto se refleja en las Figuras IV.15, IV.16, IV.17 y IV.18 respectivamente.
700
1200
700 300 0
Frecuencia
150 300
Municipio 5
0
400
Frecuencia
Municipio 4
0
Frecuencia
200 400 500
950
1250
1100
1500
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
20
2000
0
15
0
300
Frecuencia
0
200
Frecuencia
0
400
Frecuencia
200 0
400 0
700
p= 0.508
500
p= 0.521
800
p= 0.503
500
p= 0.518
Frecuencia
p= 0.507
0
450 650
1200
1600
p= 0.502
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
70
p= 0.538
0 10 p= 0.47
1600 p= 0.499
0
0
200
Frecuencia
300 0
0
Frecuencia
Frecuencia
200 0 20
200
p= 0.509
Frecuencia
p= 0.531
600
p= 0.533
400
p= 0.567
300 600
Frecuencia
100 200
Frecuencia
Municipio 3
0
200
Frecuencia
Municipio 2
0
Frecuencia
Municipio 1
750 1000 p= 0.524
650
950
p= 0.501
Figura IV.16: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 2000 y p-valor
´ CAPITULO IV. RESULTADOS
400 0
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
0 6
14
150 0
0
200
Frecuencia
0 400
Frecuencia
0 200
Frecuencia
550 750
350
p= 0.501
1700
1450
Frecuencia
p= 0.514
15
1100
1000
p= 0.512
500
p= 0.525
400
p= 0.523
200
1400
200
Frecuencia
300 0
150
Frecuencia
600 0
300
Frecuencia
350 150
Municipio 5
200
0
750
1050
200 p= 0.527
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
20
p= 0.574
0
6 12
700 950
p= 0.606
p= 0.532
0
150
Frecuencia
0
150
Frecuencia
200 0
Frecuencia
0
200 0 0
350
p= 0.508
350
p= 0.569
400
p= 0.515
Frecuencia
p= 0.583
600 1200
Frecuencia
Municipio 4
80 160
0
Frecuencia
Municipio 3
0
Frecuencia
200 400
Municipio 2
0
Frecuencia
Municipio 1
85
850
1150
p= 0.532
200 p= 0.528
Figura IV.17: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 2001 y p-valor
´ CAPITULO IV. RESULTADOS
1200
0
200
400
Municipio 5 Frecuencia
0 200
0 950
500
Municipio 4 Frecuencia
300 600
Frecuencia
400 200 700
1800
550 750
Municipio 6
Municipio 7
Municipio 8
Municipio 9
Municipio 10
14
5200
6000
0
6 12
0
0
200
Frecuencia
0
400
Frecuencia
0
150
Frecuencia
400 0 6
300 600
p= 0.525
Frecuencia
p= 0.499
1000
p= 0.512
350
p= 0.491
800
p= 0.522
0
700
950
1600
Municipio 11
Municipio 12
Municipio 13
Municipio 14
Municipio 15
p= 0.535
1000
1350
p= 0.5
1300 p= 0.502
0 200
Frecuencia
0
150
Frecuencia
0
0 20
300
Frecuencia
Frecuencia
150 0 0
500
p= 0.497
350
p= 0.503
700
p= 0.496
300
p= 0.488
350
p= 0.599
150
Frecuencia
450 650
Frecuencia
Municipio 3
0
200
Frecuencia
Municipio 2
0
Frecuencia
Municipio 1
86
800 1050
250 400
p= 0.513
p= 0.517
Figura IV.18: Chequeo predictivo posterior de los 15 municipios del estado Sucre para el a˜no 2002 y p-valor
IV.6 Tablas Comparativas por Municipio A continuaci´on se muestra en las Tablas IV.4 a IV.18 el an´alisis de cada municipio del estado Sucre, donde se presenta el riesgo relativo crudo definido en II.1.1; la mediana y los intervalos de probabilidad de cada municipio en cada a˜no de estudio, mostr´ando as´ı el posible riesgo que puede
´ CAPITULO IV. RESULTADOS
87
presentar los habitantes de los municipios de contraer la enfermedad.
Como se puede apreciar en las Tablas IV.4 a IV.18 las medianas de los municipios para cada a˜no coinciden con los riesgos relativos crudos calculados de II.1.1, por lo que e´ sto lleva a considerar que el modelo escogido se ajusta adecuadamente a los datos reales, cambiando la distribuci´on de alg´un a˜no. Tabla IV.4: Intervalo de probabilidad y riesgo relativo para el municipio Andr´es Eloy Blanco en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
2.686
2.333
2.672
3.044
1991
0.310
0.244
0.307
0.381
1992
0.522
0.385
0.525
0.713
1993
0.137
0.054
0.210
0.527
1994
0.911
0.628
0.923
1.285
1995
2.919
2.611
2.914
3.248
1996
2.952
2.693
2.947
3.221
1997
1.774
1.609
1.778
1.942
1998
0.752
0.642
0.760
0.897
1999
0.416
0.332
0.414
0.507
2000
0.441
0.377
0.443
0.514
2001
0.476
0.400
0.475
0.568
2002
1.134
1.045
1.134
1.234
En la Tabla IV.4 se aprecia que para el municipio Andr´es Eloy Blanco 8 de los 13 a˜nos no presentan un riesgo elevado de contraer la enfermedad a diferencia de los a˜nos 1990, 1995 y 1996 donde duplica el riesgo y para el 2002 el riesgo es mayor a 1.
´ CAPITULO IV. RESULTADOS
88
Tabla IV.5: Intervalo de probabilidad y riesgo relativo para el municipio Andr´es Mata en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
3.276
2.840
3.270
3.759
1991
2.556
2.345
2.553
2.772
1992
4.950
4.374
4.948
5.538
1993
6.664
5.159
6.481
7.921
1994
6.105
5.166
6.058
7.033
1995
6.095
5.599
6.083
6.588
1996
3.307
3.004
3.306
3.615
1997
1.746
1.560
1.743
1.939
1998
0.901
0.770
0.911
1.058
1999
1.725
1.543
1.724
1.920
2000
1.901
1.746
1.900
2.060
2001
1.099
0.976
1.099
1.240
2002
1.864
1.741
1.868
1.992
En la Tabla IV.5 se observa que para el municipio Andr´es Mata casi todos los a˜nos el riesgo de contraer malaria es muy elevado. Not´andose que para los primero 7 a˜nos e´ ste municipio ten´ıa uno de los mayores riesgos de presentar paludismo. El riesgo s´olo disminuy´o en 1998 pero vuelve a repuntar para el resto del per´ıodo de estudio.
´ CAPITULO IV. RESULTADOS
89
Tabla IV.6: Intervalo de probabilidad y riesgo relativo para el municipio Arismendi en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
1.435
1.255
1.434
1.646
1991
1.351
1.245
1.352
1.459
1992
1.032
0.875
1.033
1.209
1993
1.558
1.145
1.551
2.09
1994
0.396
0.277
0.414
0.600
1995
0.610
0.519
0.611
0.716
1996
2.530
2.356
2.528
2.716
1997
2.119
1.972
2.117
2.260
1998
2.465
2.303
2.465
2.646
1999
2.298
2.151
2.298
2.450
2000
2.020
1.913
2.020
2.131
2001
3.124
2.963
3.122
3.285
2002
1.370
1.298
1.370
1.444
El Municipio Arismendi por su parte se presenta en la Tabla IV.6 y aunque tambi´en presenta un riesgo relativo alto en general, no es tan elevado como el municipio Andr´es Mata. En Arismendi el riesgo se duplica en cinco a˜nos correspondientes a los a˜nos 1996 − 2000 y se triplica para 2001, disminuyendo significativamente, pero siendo a´un altamente alto el riesgo para el 2002. Se puede asegurar que entre1994 y 1995 e´ ste municpio no present´o riesgo de contraer la enfermedad.
´ CAPITULO IV. RESULTADOS
90
Tabla IV.7: Intervalo de probabilidad y riesgo relativo para el municipio Ben´ıtez en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
0.967
0.773
0.961
1.182
1991
0.848
0.753
0.848
0.951
1992
0.980
0.787
0.987
1.198
1993
2.700
2.032
2.729
3.570
1994
8.077
7.238
8.064
8.988
1995
9.965
9.441
9.961
10.48
1996
4.999
4.674
5.000
5.314
1997
2.098
1.934
2.101
2.271
1998
1.885
1.724
1.885
2.068
1999
1.570
1.424
1.568
1.726
2000
2.387
2.243
2.382
2.538
2001
3.668
3.469
3.664
3.890
2002
3.030
2.893
3.032
3.166
El municipio Ben´ıtez, el cual esta representado por la Tabla IV.7, present´o un repunte muy alto en 1994 y 1995. En 1994 el riesgo fu´e de 8, pero para el siguiente a˜no el riesgo relativo llega casi a 10, lo que ocasiona una alarma en e´ sta regi´on del estado Sucre. Entre 1990 y 1992 el riesgo fu´e casi de 1 y para el resto de los a˜nos se elev´o a´un m´as, lo que lleva a catalogar a este municipio como de alto riesgo.
´ CAPITULO IV. RESULTADOS
91
Tabla IV.8: Intervalo de probabilidad y riesgo relativo para el municipio Berm´udez en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
0.560
0.489
0.559
0.637
1991
0.032
0.023
0.032
0.044
1992
0.034
0.021
0.037
0.059
1993
0.262
0.158
0.252
0.381
1994
0.249
0.173
0.241
0.322
1995
0.008
0.003
0.008
0.017
1996
0.076
0.058
0.077
0.098
1997
0.209
0.185
0.209
0.236
1998
0.182
0.156
0.181
0.209
1999
0.231
0.203
0.232
0.259
2000
0.678
0.641
0.677
0.717
2001
0.477
0.442
0.477
0.515
2002
0.248
0.229
0.248
0.266
En la Tabla IV.8 se muestran los riesgo para el municipio Berm´udez. Se aprecia que en comparaci´on con los municipios anteriores e´ ste presenta menor riesgo de contraer paludismo. En general los valores son menores a 0.678, el cual ocurre para el a˜no 2000 y en 1995 en e´ sta regi´on, la posibilidad de presentar alg´un habitante malaria fu´e casi de 0.
´ CAPITULO IV. RESULTADOS
92
Tabla IV.9: Intervalo de probabilidad y riesgo relativo para el municipio Bol´ıvar en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
3.866
3.356
3.858
4.412
1991
1.771
1.583
1.768
1.972
1992
3.979
3.421
3.937
4.504
1993
1.298
0.650
1.172
1.926
1994
0.251
0.100
0.246
0.489
1995
0.068
0.024
0.061
0.128
1996
0.360
0.264
0.354
0.472
1997
0.651
0.537
0.650
0.778
1998
0.125
0.079
0.126
0.189
1999
0.005
0.000
0.007
0.028
2000
0.038
0.020
0.038
0.065
2001
0.032
0.014
0.032
0.065
2002
0.004
0.001
0.005
0.014
Bol´ıvar en general solo present´o un riesgo alto en 1990 − 1993, disminuyendo considerablemente su valor para el resto de los a˜nos, siendo los valores m´as bajos en 1999 y 2002 como se muestra en la Tabla IV.9. Lo que lleva a considerar que e´ ste municipio no es tan propenso a adquirir la enfermedad como otros municipios.
´ CAPITULO IV. RESULTADOS
93
Tabla IV.10: Intervalo de probabilidad y riesgo relativo para el municipio Cajigal en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
11.780
10.940
11.750
12.640
1991
9.247
8.831
9.253
9.672
1992
6.026
5.437
6.025
6.641
1993
4.194
3.160
4.177
5.401
1994
2.108
1.628
2.120
2.744
1995
2.787
2.456
2.782
3.152
1996
6.041
5.614
6.037
6.471
1997
11.87
11.350
11.870
12.390
1998
12.74
12.170
12.720
13.330
1999
10.29
9.838
10.29
10.790
2000
7.506
7.180
7.498
7.843
2001
9.145
8.729
9.144
9.547
2002
13.16
12.800
13.170
13.550
La Tabla IV.10, muestra el estudio del comportamiento del riesgo para el municipio Cajigal. Para todos los a˜nos el riesgo ha sido muy elevado para esta regi´on. El mayor riesgo relativo se present´o en los a˜nos 1990, 1997, 1998, 1999 y 2002. Este municipio es un foco mal´arico o una regi´on altamente mal´arica, por tan alto repunte de casos de esta enfermedad en comparaci´on con otros municipios.
´ CAPITULO IV. RESULTADOS
94
Tabla IV.11: Intervalo de probabilidad y riesgo relativo para el municipio Cruz Salmer´on Acosta en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
0.056
0.023
0.060
0.126
1991
0.003
0.000
0.004
0.016
1992
1.807
1.525
1.792
2.092
1993
1.793
1.213
1.751
2.435
1994
1.799
1.372
1.762
2.240
1995
0.699
0.568
0.696
0.831
1996
0.009
0.004
0.016
0.041
1997
0.003
0.000
0.005
0.018
1998
1.763
1.599
1.756
1.930
1999
0.003
0.000
0.006
0.022
2000
0.006
0.002
0.007
0.0179
2001
0.002
0.000
0.003
0.014
2002
0.001
0.000
0.002
0.008
Cruz Salmer´on Acosta es otro de los municipios que conforman el estado Sucre y es zona de estudio. Como se presenta en la Tabla IV.11 este municipio s´olo presenta alto riesgo de contraer la enfermedad en 4 de los 13 a˜nos de estudio, donde casi duplica el riesgo en este municipio. El resto de los a˜nos presenta un riesgo muy bajo de casi cero, por lo que se considera que e´ ste municipio no es propenso a contraer la enfermedad facilmente como otros municipios en el per´ıodo de estudio.
´ CAPITULO IV. RESULTADOS
95
Tabla IV.12: Intervalo de probabilidad y riesgo relativo para el municipio Libertador en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
2.500
2.051
2.502
3.000
1991
1.545
1.346
1.540
1.751
1992
1.225
0.891
1.213
1.597
1993
0.681
0.321
0.784
1.591
1994
0.128
0.051
0.191
0.480
1995
0.879
0.645
0.872
1.147
1996
2.011
1.700
2.004
2.333
1997
2.623
2.305
2.616
2.951
1998
2.912
2.536
2.911
3.286
1999
4.365
3.912
4.346
4.807
2000
4.054
3.738
4.053
4.388
2001
8.494
7.94
8.479
9.075
2002
4.128
3.847
4.125
4.415
La Tabla IV.12 presenta el municipio Libertador. M´as del 66% de los a˜nos presenta un riesgo alto (mayor a 1), present´andose el mayor repunte en 2001.
´ CAPITULO IV. RESULTADOS
96
Tabla IV.13: Intervalo de probabilidad y riesgo relativo para el municipio Mari˜no en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
5.700
5.164
5.676
6.225
1991
2.127
1.955
2.128
2.304
1992
4.802
4.308
4.773
5.307
1993
4.813
3.682
4.711
5.918
1994
2.712
2.145
2.670
3.278
1995
1.545
1.328
1.546
1.788
1996
1.610
1.419
1.611
1.813
1997
2.694
2.473
2.692
2.923
1998
3.277
3.018
3.277
3.552
1999
5.104
4.814
5.101
5.432
2000
4.051
3.836
4.044
4.272
2001
0.915
0.796
0.912
1.037
2002
3.811
3.636
3.810
3.992
La Tabla IV.13 muestra el an´alisis para el municipio Mari˜no. Para casi todos los a˜nos de estudio se presenta un riesgo relativo alto, s´olo en 2001 es bajo en comparaci´on con el resto de los a˜nos (0.91). Este municipio present´o el mayor riesgo en 1990 donde casi sextuplica la posibilidad de contraer la enfermedad.
´ CAPITULO IV. RESULTADOS
97
Tabla IV.14: Intervalo de probabilidad y riesgo relativo para el municipio Mej´ıa en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
3.839
3.329
3.821
4.415
1991
1.081
0.929
1.077
1.242
1992
0.828
0.585
0.821
1.092
1993
0.212
0.082
0.310
0.784
1994
0.548
0.291
0.537
0.902
1995
2.580
2.202
2.560
2.954
1996
0.506
0.386
0.508
0.659
1997
0.888
0.736
0.887
1.057
1998
0.214
0.143
0.221
0.316
1999
0.162
0.098
0.160
0.239
2000
0.295
0.220
0.293
0.382
2001
0.080
0.040
0.079
0.133
2002
0.038
0.019
0.039
0.069
Mej´ıa solo presenta un riesgo alto en cutro a˜nos, estos son 1990, 1991,1992, 1995 y 1997 como lo muestra la Tabla IV.14, el resto de los a˜nos se presenta un riesgo bajo, es decir, que para los 10 a˜nos restantes la poblaci´on de este municipio parece no ser propenso a contraer facilmente la enfermedad.
´ CAPITULO IV. RESULTADOS
98
Tabla IV.15: Intervalo de probabilidad y riesgo relativo para el municipio Montes en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
0.030
0.013
0.035
0.072
1991
0.008
0.003
0.010
0.020
1992
0.995
0.849
0.994
1.162
1993
1.003
0.696
0.982
1.378
1994
1.022
0.791
1.012
1.268
1995
0.027
0.014
0.032
0.059
1996
1.039
0.937
1.041
1.147
1997
0.004
0.001
0.004
0.013
1998
1.062
0.958
1.057
1.168
1999
1.074
0.985
1.077
1.175
2000
0.003
0.001
0.005
0.011
2001
0.001
0.000
0.002
0.009
2002
1.086
1.026
1.087
1.153
Montes es un municipio de riesgo relativo bajo al contraer la enfermedad en los a˜nos 1990 − 2002, pues para el per´ıodo 1990 − 2002 solo se presenta un riesgo mayor a 1 para seis a˜nos, como se muestra en la Tabla IV.16.
´ CAPITULO IV. RESULTADOS
99
Tabla IV.16: Intervalo de probabilidad y riesgo relativo para el municipio Ribero en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
1.087
0.936
1.085
1.259
1991
1.136
1.049
1.136
1.227
1992
1.409
1.229
1.402
1.602
1993
0.603
0.380
0.588
0.892
1994
1.743
1.455
1.729
2.033
1995
1.906
1.741
1.901
2.074
1996
1.834
1.703
1.834
1.981
1997
2.371
2.239
2.371
2.505
1998
1.129
1.024
1.121
1.221
1999
1.428
1.325
1.426
1.537
2000
2.186
2.086
2.185
2.289
2001
1.348
1.255
1.346
1.441
2002
1.279
1.218
1.279
1.348
El municipio Ribero por su parte, parece ser un municipio de alto riesgo de contraer malaria, pues como se presenta en la Tabla IV.16, doce a˜nos presentan un riesgo mayor a 1. La excepci´on se presenta en 1993 donde el riesgo fu´e de 0.6, pero para el resto de los a˜nos es superado considerablemente.
´ CAPITULO IV. RESULTADOS
100
Tabla IV.17: Intervalo de probabilidad y riesgo relativo para el municipio Sucre en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
0.230
0.198
0.228
0.261
1991
0.872
0.837
0.871
0.908
1992
0.198
0.171
0.198
0.229
1993
0.235
0.178
0.240
0.316
1994
0.048
0.031
0.050
0.074
1995
0.031
0.022
0.030
0.040
1996
0.127
0.111
0.126
0.143
1997
0.174
0.159
0.174
0.191
1998
0.083
0.072
0.084
0.096
1999
0.094
0.083
0.094
0.105
2000
0.180
0.169
0.180
0.193
2001
0.288
0.270
0.288
0.306
2002
0.136
0.127
0.136
0.145
En el municipio Sucre, aunque est´a presente la capital del estado Cuman´a es la que presenta menor riesgo de contraer la enfermedad, esto hace considerar que las regiones rurales influyen considerablemente en la propagaci´on del vector, por diversas causas, como por ejemplo, falta de conciencia de la poblaci´on, poco inter´es de los entes p´ublicos en erradicar la enfermedad, alta presencia de agricultura, heterogeneidad en la vegetaci´on, presencia de charcos de agua, etc. En la Tabla IV.17 se observa que los riesgos son menores a 1 para todos los a˜nos de estudio, s´olo para 1991 se presenta un riesgo cercano a 1, pero disminuye considerablemente para el siguiente a˜no.
´ CAPITULO IV. RESULTADOS
101
Tabla IV.18: Intervalo de probabilidad y riesgo relativo para el municipio Vald´ez en el per´ıodo 1990-2002 A˜no
RR crudo
2.50%
mediana
97.50%
1990
0.168
0.103
0.173
0.264
1991
0.329
0.271
0.327
0.390
1992
0.473
0.350
0.477
0.623
1993
0.791
0.467
0.771
1.226
1994
0.649
0.445
0.648
0.915
1995
0.012
0.003
0.015
0.042
1996
0.070
0.044
0.072
0.111
1997
0.185
0.142
0.184
0.236
1998
0.616
0.525
0.613
0.712
1999
1.673
1.534
1.670
1.819
2000
1.617
1.511
1.619
1.727
2001
0.626
0.551
0.626
0.708
2002
0.436
0.389
0.434
0.484
Finalmente, en la Tabla IV.18 se presenta la informaci´on para el municipio Vald´ez; en solo dos de los 13 a˜nos de estudio se presenta un riesgo mayor a 1, e´ sto ocurre en los a˜nos 1999 y 2000; para el resto de los a˜nos el riesgo es bajo, por lo que la poblaci´on de este municipio parece no ser propensa a adquirir constantemente esta enfermedad.
IV.7 Distribuciones a Posteriori de los Par´ametros del Modelo IV.3.1 Las distribuciones a posteriori de los par´ametros α, β1 , β2 , β5 y β9 del modelo (IV.3.1) se presentan en las Figuras IV.19- IV.23, donde cada densidad representa un a˜no de estudio (1990 − 2002).
´ CAPITULO IV. RESULTADOS
102
α[1] chains 1:2 sampl e: 4002 α1990 1.5
α[2] chains 1:2 sampl e: 4002 α1991 1.0 0.75 0.5 0.25 0.0
1.0 0.5 0.0 -2.0
-1.0
0.0
1.0
1.0 0.5 0.0 -3.0
-2.0
-1.0
0.0
-1.0
0.0
α[7] chains 1:2 sampl e: 4002 α1996 1.5 0.5 0.0 -2.0
-1.0
0.0
0.0 -1.0
-3.0
0.0
-2.0
-1.0
0.0
1.0
-1.0
0.0
α[9] chains 1:2 sampl e: 4002 α1998 2.0 1.0 0.0
-2.0
0.0
-1.5
-1.0
-0.5
0.0
0.5
α[12] chai ns 1:2 sampl e: 4002 α2001
α[11] chai ns 1:2 sampl e: 4002 α2000 0.6
1.0 0.75 0.5 0.25 0.0 -3.0
-2.0
3.0
-4.0
α[10] chai ns 1:2 sampl e: 4002 α1999 1.0 0.75 0.5 0.25 0.0
α[6] chains 1:2 sampl e: 4002 α1995
α[8] chains 1:2 sampl e: 4002 α1997
1.0
1.0
0.5
1.0 0.75 0.5 0.25 0.0
1.0
0.0
1.0
-2.0
1.0
-1.0
1.5
2.0 1.5 1.0 0.5 0.0 -2.0
-2.0
α[5] chains 1:2 sampl e: 4002 α1994
α [4] chains 1:2 sampl e: 4002 α1993 2.0 1.5 1.0 0.5 0.0
α[3] chains 1:2 sampl e: 4002 α1992 1.5
0.4 0.2 0.0 -3.0
-2.0
-1.0
0.0
1.0
-4.0
-2.0
0.0
2.0
α[13] chai ns 1:2 sampl e: 4002 α2002 0.8 0.6 0.4 0.2 0.0 -4.0
-3.0
-2.0
-1.0
0.0
Figura IV.19: Distribuciones a posteriori del coeficiente α para los a˜nos de estudio del modelo IV.3.1. En la Figura IV.19 se presentan las distribuciones a posteriori del coeficiente α para los a˜nos de estudio del modelo IV.3.1. Se observa que en 10 de los 13 a˜nos de estudio el intercepto influye negativamente en el modelo IV.3.1, es decir, para los a˜nos 1991, 1994 − 2002 el riesgo relativo es bajo para la poblaci´on de los municipios que presentan mayor nivel de vida; y para 1990, 1992 y 1993 otros coeficientes aportan mas informaci´on a cerca del riesgo de contraer la enfermedad.
El coeficiente α se considera como el intercepto del modelo, es decir, α se puede definir como el valor del riesgo relativo por a˜no de un municipio (cualquiera) promedio.
´ CAPITULO IV. RESULTADOS
103
β1[1] chains 1:2 sampl e: 4002 β1 1990
β1[2] chains 1:2 sampl e: 4002 β1 1991
β1[3] chains 1:2 sampl e: 4002 β1 1992
30.0
15.0
30.0
20.0
10.0
20.0
10.0
5.0
10.0
0.0
0.0 -0.15
-0.1 -0.05
0.05
β1[4] chains 1:2 sampl e: 4002 β1 1993
-0.1
0.0
0.1
30.0
20.0
20.0
10.0
10.0 -0.05
0.0
0.05
-0.1
β1[7] chains 1:2 sampl e: 4002 β1 1996 20.0 15.0 10.0 5.0 0.0
-0.05
0.0
-0.1 -0.05
0.05
-0.1
0.0
0.1
0.2
0.05
0.0
0.1
β1[9] chains 1:2 sampl e: 4002 β1 1998 20.0 10.0 0.0
-0.2
-0.1
-0.05
β1 2000 β1[11] chai ns 1:2 sampl e: 4002 8.0 6.0 4.0 2.0 0.0
-0.2
0.0
30.0
-0.3
β1[10] chai ns 1:2 sampl e: 4002 β1 1999 8.0 6.0 4.0 2.0 0.0
-0.1
0.05
β1[8] chains 1:2 sampl e: 4002 β1 1997 8.0 6.0 4.0 2.0 0.0
-0.15
-0.05
20.0 15.0 10.0 5.0 0.0
0.0 -0.1
-0.1
β1[6] chains 1:2 sampl e: 4002 β1 1995
β1[5] chains 1:2 sampl e: 4002 β1 1994
30.0
0.0
0.0 -0.2
0.0
0.05
0.1
β1[12] chai ns 1:2 sampl e: 4002 β1 2001 8.0 6.0 4.0 2.0 0.0
-0.3
-0.2
-0.1
0.1
-0.2
-0.1
0.0
0.1
β1[13] β1 2002chai ns 1:2 sampl e: 4002 15.0 10.0 5.0 0.0 -0.2
-0.1
0.0
0.1
Figura IV.20: Distribuciones a posteriori del coeficiente β1 para los a˜nos de estudio del modelo IV.3.1. En la Figura IV.20 se observa que para los a˜nos 1990, 1991, 1995 − 1997 y 2000 la variable X1 el estado presenta un bajo riesgo relativo de que la poblaci´on contraiga paludismo en comparaci´on con 1998; no se aporta informaci´on en para 1992 − 1994, 1999, 2001 − 2002.
´ CAPITULO IV. RESULTADOS
104
β2[1] chains 1:2 sampl e: 4002 β2 1990 15.0
10.0
10.0
5.0
5.0
0.0
20.0 15.0 10.0 5.0 0.0
0.0 -0.2
-0.1
0.0
0.1
-0.1
0.0
0.1
0.2
20.0
20.0 0.0 -0.05
0.0
0.05
5.0 0.0 -0.1
β2[7] chains 1:2 sampl e: 4002 β2 1996 20.0 15.0 10.0 5.0 0.0
0.0
0.1
0.0
15.0
4.0
10.0
2.0
5.0
-0.2
2.0 0.0 -0.2
0.0
0.2
-0.1
0.0
β2[11] chai ns 1:2 sampl e: 4002 β2 2000 8.0 6.0 4.0 2.0 0.0
4.0
0.0
0.1
0.0 -0.4
β2[10] chai ns 1:2 sampl e: 4002 β2 1999
-0.1
β2[9] chains 1:2 sampl e: 4002 β2 1998
β2[8] chains 1:2 sampl e: 4002 β2 1997
0.1
6.0
-0.2
6.0
0.0 -0.1
0.1
10.0
0.0 -0.1
0.0
15.0
10.0
10.0
-0.1
β2[6] chains 1:2 sampl e: 4002 β2 1995
β2[5] chains 1:2 sampl e: 4002 β2 1994
β2[4] chains 1:2 sampl e: 4002 β2 1993 30.0
β2 1992 β2[3] chains 1:2 sampl e: 4002
β2[2] chains 1:2 sampl e: 4002 β2 1991
15.0
0.0
0.1
β2[12] chai ns 1:2 sampl e: 4002 β2 2001 4.0 3.0 2.0 1.0 0.0
-0.4
-0.2
0.0
-0.6
-0.4
-0.2
0.2
β2[13] chai ns 1:2 sampl e: 4002 β2 2002 10.0 5.0 0.0 -0.1
0.0
0.1
0.2
Figura IV.21: Distribuciones a posteriori del coeficiente β2 para los a˜nos de estudio del modelo IV.3.1. En cuanto a la Figura IV.21, la cual presenta las distribuciones a posteriori del coeficiente β2 para los a˜nos de estudio del modelo IV.3.1, se observa que la variable X2 muestra una alta posibilidad en contraer la enfermedad para 6 de los 13 a˜nos de estudio en aquellos municipios cuya calidad de vida mejora; solo 2 a˜nos no aportan informaci´on valiosa para predecir si ocurre posibilidad de contagio de la poblaci´on y en los 5 municipios restantes la posibilidad de adquirir a enfermedad es baja.
Comparando las Figuras IV.20 y IV.21 se observa que para los a˜nos 1995 − 1997 y 2000 las variables X1 y X2 muestran que la poblaci´on del estado Sucre no es tan propensa de cotraer la enfermedad en comparaci´on con el n˜ o 1998. Mientras que para 1993 estas variables no aportan
´ CAPITULO IV. RESULTADOS
105
informaci´on a cerca del riesgo de contraer malaria. Un an´alisis an´alogo se puede realizar para el resto de los a˜nos. β5[1] chains 1:2 sampl e: 4002 β5 1990
β5[2] chains 1:2 sampl e: 4002 β5 1991
β5[3] chains 1:2 sampl e: 4002 β5 1992
30.0
30.0
30.0
20.0
20.0
20.0
10.0
10.0
10.0
0.0
0.0 -0.1
-0.05
0.0
0.05
β5[4] chains 1:2 sampl e: 4002
0.0
0.05
30.0 10.0 0.0 0.0
0.05
-0.05
β5[7] chains 1:2 sampl e: 4002 β5 1996 15.0
20.0
10.0
10.0
5.0
0.0
0.0
0.05
0.1
0.0
0.05
0.1
-0.2
β5[10] chai ns 1:2 sampl e: 4002 β5 1999 10.0 7.5 5.0 2.5 0.0
-0.1
0.0 0.2
0.05
0.1
0.15
0.05
0.075
0.1
β5[12] β5 2001chai ns 1:2 sampl e: 4002 10.0 7.5 5.0 2.5 0.0
5.0 0.1
0.025
β5[11] chai ns 1:2 sampl e: 4002 β5 2000 10.0
0.0
0.1
β5[9] chains 1:2 sampl e: 4002 β5 1998
0.0
15.0
-0.1
0.05
40.0 30.0 20.0 10.0 0.0
0.0 -0.05
0.0
β5[8] chains 1:2 sampl e: 4002 β5 1997
30.0
0.0
β5[6] chains 1:2 sampl e: 4002 β5 1995 20.0 15.0 10.0 5.0 0.0
20.0
-0.05
-0.05
β5[5] chains 1:2 sampl e: 4002 β5 1994
β5 1993
40.0 30.0 20.0 10.0 0.0
0.0 -0.05
-0.1
0.0
0.1
-0.1
0.0
0.1
β5[13] chai ns 1:2 sampl e: 4002 β5 2002 20.0 15.0 10.0 5.0 0.0 0.0
0.05
0.1
0.15
Figura IV.22: Distribuciones a posteriori del coeficiente β5 para los a˜nos de estudio del modelo IV.3.1. En la Figura IV.22 se muestra las distribuciones a posteriori del coeficiente β5 para los a˜nos de estudio del modelo IV.3.1. Se muestra una alta influencia del riesgo relativo para la variable X5 (Agricultura) en los a˜nos 1990−1996 , 1998, 1999 y 2002, es decir, que para estos a˜nos la poblaci´on presenta alto riesgo de contraer malaria para aquellos municipios que presentan un menor nivel de vida; solo para 1997 se presenta un bajo riesgo relativo de contraer la enfermedad y para el a˜no 2000 esta variable no aporta informaci´on a cerca de si el estado es propenso a contraer malaria.
´ CAPITULO IV. RESULTADOS
106
β9[1] chains 1:2 sampl e: 4002 β9 1990 0.8 0.6 0.4 0.2 0.0
β9[2] chains 1:2 sampl e: 4002 β9 1991 0.3 0.2
0.1
0.1
0.05
0.0 -6.0
-4.0
-2.0
0.0
0.0 -5.0
β9[4] chains 1:2 sampl e: 4002 β9 1993 0.3
0.0
5.0
10.0
0.2
0.1
0.1
0.05 0.0
10.0
-20.0
β9[7] chains 1:2 sampl e: 4002 β9 1996
-10.0
0.0
10.0
-2.0
β9[8] chains 1:2 sampl e: 4002 β9 1997 0.15
0.6
0.1
0.4
0.1
0.05
0.2
0.0
0.0 0.0
0.3
0.0
10.0
0.1 0.0 -10.0
-5.0
0.0
-2.0
β9[11] chai ns 1:2 sampl e: 4002 β9 2000 0.8 0.6 0.4 0.2 0.0
0.2
-1.0
0.0
1.0
0.0 -10.0
β9[10] chai ns 1:2 sampl e: 4002 β9 1999
10.0
β9[9] chains 1:2 sampl e: 4002 β9 1998
0.2
-5.0
0.0
β9[6] chains 1:2 sampl e: 4002 β9 1995
0.3
-10.0
-10.0
1.0 0.75 0.5 0.25 0.0
0.0 -10.0
-20.0
β9[5] chains 1:2 sampl e: 4002 β9 1994 0.15
0.0
β9[3] chains 1:2 sampl e: 4002 β9 1992 0.15
0.0
2.0
4.0
β9[12] chai ns 1:2 sampl e: 4002 β9 2001 0.4 0.3 0.2 0.1 0.0
-4.0
-2.0
0.0
-4.0
-2.0
0.0
2.0
β9[13] β9 2002chai ns 1:2 sampl e: 4002 0.8 0.6 0.4 0.2 0.0 -2.0
-1.0
0.0
1.0
Figura IV.23: Distribuciones a posteriori del coeficiente β9 para los a˜nos de estudio el modelo IV.3.1. Finalmente se presenta la Figura IV.23, donde se muestran las distribuciones a posteriori del coeficiente β9 para los a˜nos de estudio el modelo IV.3.1. Se observa que para los a˜nos 1991, 1993, 1997 y 1998 la poblaci´on del estado Sucre fu´e mas propensa en presentar la enfermedad para aquellos municipios donde el nivel de vida se considera bajo. La variable no aporta informaci´on para 2 de los a˜nos de estudio (1992 y 1995), es decir que otras variables involucradas en el modelo pueden explicar mejor el comportamiento del riesgo relativo para contraer la malaria; y finalmente en 7 a˜nos se presenta un bajo riesgo relativo de contraer la enfermedad para los municipios con alto nivel de vida.
´ CAPITULO V CONCLUSIONES Y RECOMENDACIONES El estado Sucre presenta una diversidad considerable en la propagaci´on y desarrollo del mosquito del g´enero Anopheles por distintos factores como la diversidad de la vegetaci´on, falta de conciencia de la poblaci´on en la prevenci´on de la enfermedad, falta de ayuda gubernamental en la erradicaci´on del vector, entre otros.
La pobreza, la agricultura y los cambios clim´aticos influyen en la propagaci´on de la malaria en el per´ıodo de estudio 1990 − 2002 en los 15 municipios del estado Sucre, donde estas variables son expresadas en el siguiente modelo bayesiano espacio temporal que se ajust´o; este modelo es de la forma yit ∼ Poiss(Eit eαt +βt .Xit +vit +bit ), donde las covariables incluidas en X son: • X1 : Porcentaje de viviendas con materiales de mala calidad y carencia de servicios b´asicos. • X2 : Porcentaje de personas en hogares pobres y viviendas con materiales de calidad regular. • X5 : Agricultura. 107
´ CAPITULO V. CONCLUSIONES Y RECOMENDACIONES
108
• X9 : M´aximo de precipitaci´on. Los par´ametros v y b capturan la heterogeniedad del modelo, siendo b el componente CAR y e´ ste juega un papel importante en el ajuste del modelo pues captura la heterogeneidad entre municipios vecinos. El modelo fu´e escogido mediante el estudio del criterio de m´ınima p´erdida predictiva D, donde el mejor modelo es aquel que presenta el menor valor del criterio.
En cuanto al ajuste de los datos del modelo, los resultados del p-valor o p-bayesiano indican que el modelo es adecuado como representaci´on del riesgo relativo a escala municipal. En el caso particular que el modelo no se ajuste adecuadamente, se sugiere utilizar otros medios de ajuste, como por ejemplo modificaci´on de algunos par´ametros o densidades de las distribuciones de inter´es, como ocurri´o en el a˜no 1997, en el cual debido al mal ajuste del modelo se consider´o utilizar una distribuci´on de colas pesadas (en e´ ste caso se consider´o una distribuci´on t − student), con el fin de capturar la heterogeneidad que no pudo absorver el componente CAR del modelo. Por lo tanto, se sugiere que en el caso de no ajustarse bien un a˜no en particular, realizar un estudio local.
De los 15 municipios del estado Sucre en el per´ıodo de estudio 1990 − 2002, 7 presentaron un riesgo relativo mayor a 1 en casi todos los a˜nos, e´ stos son: Ribero, Mari˜no, Libertador, Cajigal, Ben´ıtez, Arismendi y Andr´es Mata, donde la mayor´ıa de e´ stas regiones presentaron mayor n´umero de casos de malaria en el estado Sucre en los a˜nos de estudio. Estos municipios presentaron la similitud de ser en general pobres, agr´ıcolas y altamente mal´aricos, donde el foco se present´o en el municipio Cajigal.
Considerando los datos presentados en la Figura III.1, se observa que el componente CAR, jug´o un papel imporante en el modelo ajustado, pues 6 de los 7 municipios referenciados anteriormente son vecinos del municipio Cajigal, foco mal´arico a trav´es de los a˜nos, lo que implica que la cualidad de ser municipios vecinos influyen en la expansi´on del vector.
´ CAPITULO V. CONCLUSIONES Y RECOMENDACIONES
109
Las densidades a posteriori de los par´ametros del modelo IV.3.1 reflejan que la poblaci´on del estado Sucre es propensa a enfermarse en m´as de la mitad de los a˜nos de estudio; siendo la agricultura y el m´aximo de la precipitaci´on covariables que influyen directamente en la proliferaci´on del mosquito, seguido de las covariables de pobreza.
En este trabajo se considera que el tiempo y los casos de malaria son independientes de lo que pueda ocurrir al a˜no siguiente, por lo que se recomienda ajustar un modelo bayesiano donde tanto el tiempo como los casos de paludismo est´en relacionados con el a˜no o eventos previos, como se emple´o en el modelo ajustado en [36].
Para el modelo escogido IV.3.1 se consider´o una matriz binaria W, la cual est´a representada en II.4.1; autores como [16] implementaron en su modelo tres estructuras diferentes para la matriz de pesos W, donde concluyeron que definir una matriz W diferente a la usual (binaria) puede mejorar el modelo; con e´ sto se sugiere aplicar otras matrices de pesos al momento de implementar el modelo bayesiano.
Se sugiere la implementaci´on de otras covariables que ayuden a explicar de manera mas detallada la influencia de la malaria en el estado Sucre, como por ejemplo cantidad de personas que ingresan al estado con la enfermedad (casos importados de malaria), entre otros.
Una mayor disposici´on y diversidad de datos actualizados por parte de entes gubernamentales, ser´ıa de gran ayuda al momento de realizar estudios para implementar las covariables a los modelos.
REFERENCIAS [1] BANERJEE, S., CARLIN, B. P., Y GELFAND, A. (2003). Hierarchical Modeling and Analysis for Spatial Data, Chapman & Hall / CRC. [2] BARRERA, R., GRILLET, M. E., RANGEL, Y., BERTI, J., Y ACHE, A. (1998). Estudio ecoepidemiol´ogico de la reintroducci´on de la malaria en el nororiental de Venezuela mediante Sistemas de Informaci´on Geogr´afica y Sensores Remotos. Bol. Mal. Sal.Amb, 38,pp. 14-31. [3] BESAG, J.(1974). Spatial Interaction and the Statistical Analysis of Lattice Sistems (with discussion). J. Roy. Statist.Soc. Ser. B, 43, pp.25-73. ´ A. (1991). Bayesian image restoration, whith two aplications in [4] BESAG, J., Y MOLLIE, spatial statistics. Annals of the Statistical Mathematics,43, pp. 1-59. [5] BEN´ITEZ, J. A., Y RODRIGUEZ-MORALES, A . (2004). Malaria de Altura en Venezuela ¿Consecuencia de las variaciones clim´aticas?, CIMEL, Vol 9, N°1. [6] BRAVO, L., LLATAS, I., HERMANDEZ, M. E. (2008). An´alisis de Datos con T´ecnicas Bayesianas, XXI Escuela Venezolana de Matem´aticas. Escuela Matem´aticas de Am´erica Latina y el Caribe. Emalca-Venezuela 2008. Merida, Venezuela del 3 al 9 de Septiembre de 2008. [7] CLAYTON, D. G., Y KALDOR, J. (1987). Empirical Bayes estimates of age-standardized relative risk for use in disease mapping, Biometric, 43, pp. 671-681
110
REFERENCIAS
111
´ [8] CACERES, J.L., VELA, F. A.(2003). Reporte Epidemiol´ogico. Incidencia Mal´arica en Venezuela Durante el a˜no 2002. Bol. Mal. Sal. Amb, N°1, 43, pp. 53-58. ´ ´ [9] CACERES, J. L. (2004). Estado Sucre: EL Exito Antimal´arico de Venezuela en el a˜no 2003. Bol. Mal. Sal. Amb, 45, pp. 27-36. ´ [10] CACERES, J. L. (2004). Eficacia de la Cura Radical Masiva en la Incidencia Mal´arica del Municipio Mari˜no, Estado Sucre. Bol. Mal. Sal. Amb, N°1, 44, 45-49. ´ ´ W., ROJAS, J.G., MORA, J.D., SANCEZ, [11] CACERES, J. L., PIZZO, N., VELA, F., PEREZ, ´ E., BUTRON, ´ L., RUBIO, N., Y MALDONADO, A. (2005). Impacto de la Cura E., PAEZ, Radical Masiva sobre la incidencia sobre la mal´arica del estado Sucre, Venezuela. Bol. Mal. Sal. Amb, 44, pp. 51-55. [12] DALLAS, E. J. (1998). M´etodos multivariados aplicados al an´alisis de datos. Thomson Editores. [13] DELGADO, L., Y RAMOS, S. La Malaria y su contexto Espacial. Caso de Estudio:
El Estado Sucre en Venezuela. Extraido el 15 de julio de 2009 desde
http://www.geogra.uah.es/inicio/web 11 confibsig/PONENCIAS/2-058%20DelgadoRamos-Camardiel.pdf. [14] DE SMITH, M., Y LONGLEY, P. A. (2006). Geospatial Analysis: A Comrehensive Guide to Principles, Techniques and Sowftware Tools (2nd Ed). Troubador Pblishing LTD. Version gratis en l´ınea: http//www.spatialanalysisonline.com/ [15] EVANS, M., Y SWARTZ, T. (1995). Methods for approximating integrals in statistics with special emphasis on Bayesian integration problems. Statistical Science, 10,pp. 254-272. [16] FERREIRA, G. S, Y SCHMIDT, A. M. (2006). Spatial modelling of the relative risk of dengue fever in Rio de Janeiro for the epidemic period between 2001 and 2002. Brazilian journal of Probability and Statistics 20, pp. 29-47.
REFERENCIAS
112
´ [17] GABALDON, A., Y BERTI, A. (1954). The first large area in the tropical zone to report malaria eradication: north - central Venezuela. Am. J. Trop. Med. Hyg. 8, pp. 793-807. [18] GAMERMAN, D. (1974). Markov Chain Monte Carlo. Chapman Hall, New York. [19] GELFAND, A.E, Y GHOSH, S. K. (1998), Model choice: a minimum posterior predictive loss approach. Biometrika, 85, pp. 1-11. [20] GELFAND, A., Y SMITH, A. (1990). Sampling-based approaches to calculating marginal densities. Journal of the American Statistical Association, 815, pp. 398-409. [21] GELMAN, A., CARLIN, J., STERN, H, Y RUBIEN, D. (2004). Bayesian Data Analysis. Second Edition. Chapman & Hall/ CRC. [22] GILKS, W. R., RICHARDSON, S, Y SPIEGELHALTER, D. (1996). Markov Chain Monte Carlo in Practice. Chapman & Hall. [23] http://www.orecsucre.com.Extraido el 10 de agosto de 2009 [24] http://portal.unesco.org/education/es/ev.php-URL ID=36655&URL DO=DO TOPIC& URL SECTION=201.html. Extraido el 20 de noviembre de 2008 [25] http://edosucre.gov.ve/new home/home/. Extraido el 1 de mayo de 2009 [26] http://www.rena.edu.ve/venezuela/sucre.html. Extraido el 1 de mayo de 2009 [27] KALDOR, J., Y CLAYTON, D. (1989). Role of advanced statistical techniques in cancer mapping, P. Boyle, C.S. Muir & E Grundmann, edss Springer-Verlag, Berlin. [28] KELSALL J., Y WAKEFIELD, J. (1999). Discussion of “Bayesian models for spatially correlated disease and exposure data”. En Bayesian Statitic 6, Bernardo J.M., Berger J.O., Dawid A.P., Smith A.F.M (eds) Oxford University Press, Oxford, pp. 151.
REFERENCIAS
113
[29] LAUD, P. W., E IBRAHIM, J. G. (1995). Predictive model selection. J. Roy. Statist. Soc.Ser.B, 57, pp. 247-262 [30] LAWSON, A. B., BROWNE, W. J., Y RODEIRO, C. L. V. (2003). Disease Mapping with WinBUGS and MLwiN, wiley. [31] Le, N. D., Y ZIDEK, J. (2006). Statistical Analysis of Environmental Space-Time Processes. Springer. [32] MORAN, P. (1948). The interpretation of statistical maps, Journal of the Royal Statistical Society B, 10, pp. 243-251. ´ A. (1996) Bayesian mapping of disease . In Markov Chain Monte Carlo in Pratice [33] MOLLIE, (eds W.R.Gilks, S. Richardson and D.J.Spielhater), Champman & Hall, pp. 359-379. [34] MONSALVE, G. N. (2005). Modelaje Bayesiano Espacio-Temporal de Factores Asociados con la Incidencia del Dengue en el a´ rea de Maracay, Tesis de maestr´ıa en Estad´ıstica de la Universidad Sim´on Bol´ıvar. [35] BERTI, M., J., Y RIVAS, J. G. (2004). Evaluaci´on de la Efectividad y Persistencia de una nueva formulaci´on de Bacillus sphaericuscontra larvas de Anopheles aquasalis Curry (Diptera: Culicidae) en criaderos naturales del Estado Sucre, Venezuela. Bol. Mal. Sal.Amb, 44, pp. 21-27. [36] NOBRE, A. A., SCHMIDT,A. M., Y LOPES, H. F. (2005). Spatio-temporal models for mapping the Incidence of malria in Par´a. Envirometrics, 16, pp. 291-304. [37] METROPOLIS, N., Y ULAM, S. (1949). “The Monte Carlo Mehod”, Journal of the American Statistical Association, 44, pp. 335-341 [38] OMS. World malaria situation in 1993, part I. Weekly Epidemiological Record 1996, 71, pp. 17-22
REFERENCIAS
114
[39] Organizaci´on Panamericana de la Salud/ Organizaci´on Mundial de la Salud.1998. Informe de la situaci´on de los programas de malaria en las Am´ericas. 41, pp. 1-35. ˜ D. (2002). An´alisis de datos Multivariados, Mc Graw Hill. [40] PENA, ˜ [41] POVEDA, G., ROJAS, W., QUINONES, M. L., V’ELEZ, I. D., MANTILLA, R. I., RUIZ, D., ZULUAGA, J.S., Y RUA, G.L. (2001). Coupling between Annual and ENSO Timescales in the Malaria-Climate Association in Colombia. Environmrntal Health Perspectives, 109, 5, pp. 489-493. [42] POVEDA, G., Y ROJAS, W. (1997). Evidencias de la Asociaci´on entre Brotes Epid´emicos de la Malaria en Colombia y el Fen´omeno El Ni˜no-Oscilaci´on del Sur. Rev. Acad. Colomb. Cienc, 21(81), pp. 421-427. [43] Ripley, B. D. (1981). Spatial Statistics.New York: Wiley. [44] RODR´IGUEZ, J. (2009). Modelaje de la vulnerabilidad de la poblaci´on Venezolana a eventos de lluvia extrema, Tesis de maestr´ıa en Estad´ıstica de la Universidad Sim´on Bol´ıvar, Departamento de C´omputo Cient´ıfico y Estad´ıstica. [45] RODR´IGUEZ-MORALES, A., DELGADO, L., MART´INEZ, N., Y FRANCO-PAREDES, C. (2006). Impact of Imported Malaria on the Burden of Disease in Northeaster in Venezuela, Journal of Travel Medicine, Vol 13, N°1, pp. 15-20. [46] ROSSI, P. E., ALLENBY, G, Y McCOLLUCH, R. (2005). Bayesian Statistics, and Marketing. Wiley. [47] ROWE, D. B. (2003). Multivariate Bayesian Statistics (Methods for Source Separation and Signal Unmixing). Chapman & Hall / CRC. [48] KNELL, A. J. (1999) Malaria. Oxford University Press. Oxford.
REFERENCIAS
115
[49] SMITH, A. F. M. (1991). Bayesian computational methods. Phil. Trans. R. Soc. Lond. 24 MCMC and Gibbs Sampling A, 337, pp. 369-386. [50] ROBERTS, G., Y SMITH. (1994). Simple conditions for the convergence of the Gibbs sampler and Metropolis-Hastings algorithms. A. F. M. University of Minnesota. [51] SPIELGELHALTER, D. J., BEST, N., CARLIN, B. P., Y VAN DER LINDE, A. (2002). Bayesian measures of model complexity and fit (with discussion). J Roy. Statist.Soc., Ser. B, 64, pp. 583-639. [52] TANNER, M. A. (1996). Tools for statistical inference, 3rd ed. Springer-Verlag, New York. [53] World Health Organization (2000) WHO Expert Committee on Malaria: Twentieth Report, WHO Technical Report Series No. 892. [54] Situaci´on de los Programas de Malaria en las Am´ericas. Boletin epidemiol´ogico, Vol 22, marzo 2001. Disponible en http://www. paho.org/spanish/sha/be v22n1-malaria.htm
´ APENDICE A Variables Clim´aticas Para obtener las interpolaciones del campo de lluvia mensual de las 23 estaciones del estado Sucre, se realizaron algunos an´alisis previos, como: la agrupaci´on de estaciones en grupos de reg´ımenes semejantes usando el m´etodo de las k-medias; la completaci´on de datos faltantes seg´un la necesidad (agrupamiento en zonas geogr´aficas o´ imputaci´on mediante m´etodo bayesiano) y finalmente la aplicaci´on del m´etodo de interpolaci´on por kriging bayesiano.
A.1 M´etodo de Interpolaci´on Se utiliz´o el m´etodo de Kriging Bayesiano Jer´arquico para calcular el campo de lluvia mensual en el estado Sucre. Para una referencia detallada de e´ ste m´etodo, se puede revisar en [31]. Los autores han hecho accesible sin costo un conjunto de rutinas que realizan los c´omputos necesarios para la implementaci´on de esta metodolog´ıa. Estas rutinas conforman el paquete Enviro.Stat, revisar (http://enviro.stat.ubc.ca/statisticalanalysis/).
Las caracter´ısticas del m´etodo de interpolaci´on seleccionado, se pueden resumir en: 1. Manejo de datos faltantes en forma de escalera.
116
117 2. Posibilidad de interpolar campos anisotr´opicos, mediante la incorporaci´on del procedimiento de Sampson y Guttorp para la matriz de covarianzas. 3. Estimaci´on de la matriz de covarianzas que sirve de par´ametro efectivo para entender la asociaci´on entre los valores de lluvia en diferentes lugares. 4. Posibilidad de utilizar la matriz de covarianzas obtenida para sugerir puntos de medici´on nuevos (extensi´on de red de medici´on) de tal manera que se maximice la informaci´on obtenida de toda la red.
A.1.1 Modelo B´asico En este m´etodo, el campo a interpolar se considera una realizaci´on de una variable Gaussiana p − variada parcialmente observada. En este sentido, p es el n´umero total de lugares (por ejemplo cuadros en un mapa) donde se tendr´a una estimaci´on del campo o variable, incluyendo los lugares donde ya se tiene informaci´on. Espec´ıficamente, el campo de lluvia en el tiempo t, se representa: Yt = (Ytdes , Ytobs ) Donde Ytdes corresponde a los valores de la variable Yt no observados (lugares donde nos gustar´ıa tener una estimaci´on de la lluvia) y Ytobs corresponde a los valores de la variable Yt observados (lugares donde hay estaciones pluviom´etricas). M´as all´a de eso, se asume el siguiente modelo para Yt : Yt = (Ytdes , Ytobs )|zt , B, Σind ∼ N(zt , B, Σ),
(A.1.1)
donde zt es un vector de covariables de longitud k (ejemplo: indicador del mes del a˜no al que corresponde t) y B es una matriz k × p de coeficientes de regresi´on (ejemplo: los efectos mensuales a estimar para cada mes). Las covariables, en este m´etodo, deben ser las mismas para cada lugar. Se asume que, dados zt , B, Σ, las variables Yt (t = 1, ..., T ) son independientes entre s´ı. La matriz
118 p × p de covarianzas Σ es el par´ametro que modela la asociaci´on espacial entre las componentes de Yt . Los par´ametros a su vez se particionan, seg´un la parte de Yt a la que correspondan: Σ des, des Σdes, obs Σobs, des Σobs, obs
, B =
β11 · · · β p1 .. . . . . .. ≡ (B(des) , B(obs) ). . β1k · · · β pk
Donde las sub-matrices Σdes, des y Σobs, obs y denotan las covarainzas de Ytdes y Ytobs , respectivamente. La matriz Σdes, obs representa las correspondientes covarianzas entre valores observados y no observados.
Como el an´alisis estad´ıstico se realiza desde el punto de vista bayesiano, se asignan distribuciones previas a los par´ametros del modelo: B|B0 , Σ, F ∼ Nkp (B0 , F −1 ⊗ Σ)
(A.1.2)
Σ|Ψ, δ ∼ Inv.W p (Ψ, δ),
(A.1.3)
donde la distribuci´on para B es normal multivariante con media B0 y una matriz de covarianzas relacionada con Σ a trav´es de la matriz k × k que denominamos F. La distrbuci´on de Σ es inversa Wishart con matriz de escala Ψ y grados de libertad δ. Todos los par´ametros de las nuevas distribuciones dadas en (A.1.2) y (A.1.3) se denominan hiper-par´ametros. En un modelo completamente bayesiano se asignar´ıan previas a su vez para estos hiper-par´ametros, sin embargo, en esta investigaci´on se utiliza el m´etodo Bayes emp´ırico que consiste en sustituir cada uno de estos par´ametros por el valor que produzca el m´aximo de su distribuci´on marginal dados los datos.
Las distribuciones predictivas de los componentes de Yt se pueden hallar en forma cerrada, y resultan ser distribuciones t-student multivariadas (consultar cap´ıtulo 9 de [31]). De e´ stas se pueden obtener estimados para todo el campo de lluvia, si se provee el vector de coraviables zt .
119
A.1.2 Manejo de Datos Faltantes En el m´etodo esbozado arriba, se puede manejar el caso de datos faltantes, siempre que el patr´on de datos faltantes sea en forma de “escalera”, como se observa en la Figura A.1. En este patr´on, algunas estaciones tienen un registro de datos m´as largo que otras, y se agrupan en bloques las estaciones que coincidan en cuanto al per´ıodo de operaci´on. De manera que se consideran como “datos faltantes” (NA) aquellos datos no obtenidos por las estaciones m´as recientes, cuando ya las m´as antiguas estaban en funcionamiento.
Por supuesto, es necesario introducir algunas modificaciones en el modelo b´asico para realizar la interpolaci´on con estos datosfaltantes. Los detalles son engorrosos, pero la innovaci´on determi-
Tiempo
bloque 1
No observados
bloque 2
bloque k
Observados
Figura A.1: Patr´on de datos faltantes en forma de escalera. nante en el modelo b´asico es la sustituci´on de la previa dada en (A.1.3) por la distribuci´on “Inversa
120 Wishart Generalizada”. Esta distribuci´on contempla m´ultiples grados de libertad y una estructura m´as rica para las submatrices de Ψ. Para el m´etodo de interpolaci´on se aprovecha la caracter´ıstica de m´ultiples grados de libertad, pues e´ stos permiten representar distintos niveles de incertidumbre asociados a distintas sub-matrices de la matriz de covarianzas. Las sub-matrices representando mayor incertidumbre corresponden a los bloques de estaciones m´as abajo en la escalera (con menor cantidad de datos). Para mayores detalles, consultar el cap´ıtulo 9 de [31].
´ el R´egimen de Lluvia A.1.3 Agrupamiento de Estaciones Segun El m´etodo de interpolaci´on presentado requiere, en su implementaci´on actual en Enviro.Stat, que los efectos mensuales sean aproximadamente iguales para los datos de las estaciones de un regi´on sobre la cual se quiere interpolar. Por este motivo, es necesario identificar dichos efectos para cada estaci´on y luego crear c´umulos de estaciones que tengan efectos mensuales similares. Luego, estaciones dentro de un mismo c´umulo pueden ser usadas para la interpolaci´on del campo de lluvia en la regi´on donde se encuentran.
A.1.4 Completaci´on de Datos Faltantes en Varias Estaciones Como se mencion´o en (el m´etodo de interpolaci´on) el m´etodo admite la introducci´on de datos faltantes. Sin embargo, estos datos faltantes deben hallarse en forma de “escalera”. En muchas estaciones del estado Sucre Venezuela de las que se tienen datos, se observan interrupciones en el historial de datos luego del inicio de operaciones. En este caso, no se pueden introducir estos datos sin completar de alguna manera los datos correspondientes a esas introducciones.
Por ese motivo, se completaron los datos de las estaciones que presentaban esta situaci´on. En pocas palabras, el m´etodo aprovecha la asociaci´on entre las observaciones, aprendida en base a los datos que s´ı se observan, para luego imputar el valor de los datos faltantes en un tiempo t usando los valores que s´ı se observan en otras estaciones cercanas para ese tiempo t.
121
A.1.5 M´etodo de Imputaci´on An´alisis previos indican que la variable obtenida al extraer la ra´ız cuadrada de la cantidad de lluvia mensual observada se puede representar, luego de restar los efectos temporales estacionarios, mediante una variable aleatoria Normal. De all´ı que la variable p-dimensional de todo el campo de lluvia se pueda modelar mediante una distribuci´on Gaussiana o Normal p-variada. Espec´ıficamente, sea Yt = (Yt1 , ..., Ytp ) la ra´ız cuadrada de la cantidad de lluvia ca´ıda en el mes t, en los p lugares donde se mide lluvia. Entonces se asume que Yt |zt , B, Σ, ∼ N p (xt , B, Σ) Donde B es la matriz 12 × p de efectos mensuales, xt es un vector de variables mudas que tiene 1 en la entrada j si t corresponde al mes j con ( j = 1, ..., 12) y cero en otro caso; y Σ es la matriz de covarianzas que servir´a para captar la asociaci´on espacial entre los valores de los diferentes lugares. Por ahora se asume que se observa todo el vector Yt , luego se atender´a el problema de entradas faltantes.
Como el m´etodo de an´alisis es bayesiano, es necesario asignar distribuciones previas a los par´ametros. Para mayor facilidad de desarrollo, se sustituir´a la matriz B12×p por el vector de longitud 12.p, los resultados sin embargo, ser´an equivalentes (referente a esto y a las ecuaciones que siguen a continuaci´on se puede ver, por ejemplo, el cap´ıtulo 8 de [47], o el cap´ıtulo 2 de [46]).
La previa para (B, Σ) se puede escribir como, p(Σ, B) = p(Σ)p(B|Σ), Σ v W(υ0 , V0 ), ¯ Σ ⊗ A−1 ). β|Σ v N(β, Y las distribuciones condicionales a posteriori vienen a ser Σ|Y, X v IW(υ0 + n, V0 + S˜ ) 0
˜ Σ ⊗ (X X + A)−1 ), β|Y, X, Σ v N(β,
(A.1.4) (A.1.5)
122 ˜ B˜ = (X 0 X + A)−1 )(X 0 X Bˆ + A B) ¯ y S˜ = (Y − X B) ˜ 0 (Y − X B) ˜ + ( B˜ − B) ¯ 0 A( B˜ − B) ¯ donde, β˜ = vec( B), Siendo X = (x1 , ..., xn )t la matriz de dise˜no del modelo, y Y = (y1 ..., yn )t la matriz de datos. Se puede entonces tomar muestras de la distribuci´on de p(β, Σ|X, Y) y de la distribuci´on predictiva p(Y f |x f , Y), usando las distribuciones a posteriori en (A.1.4) y (A.1.5) con el m´etodo MCMC (consultar [22]).
Ahora se acepta que, en algunos vectores Yt existen entradas sin datos, es decir, Yt = (yt1 , ..., NA, NA, yti , ..., ytp ) . Dentro del enfoque bayesiano tales entradas pueden ser consideradas par´ametros cuyas distribuciones hay que hallar a la luz de los datos existentes.
Para un vector X = (X1 , X2 ) subdividido en dos partes, tal que su distribuci´on es Normal multivariada X µ 1 1 v N p X2 µ2
Σ 11 Σ12 , Σ21 Σ22
Si se observa el sub-vector r-dimensional (r < p) X1 , entonces se conoce la distribuci´on del resto, y viene dada por (X2 |X1 = x1 ) v N p−r (µ2 + Σ21 Σ−1 11 (x1 − µ1 ), Σ22.1 )
(A.1.6)
Para el valor concreto x1 observado. Donde Σ22.1 = Σ22 − Σ21 Σ−1 11 Σ12 . Ahora se puede tomar muestras de las distribuciones de los datos faltantes mediante el siguiente algoritmo
123
A.1.6 Algoritmo Inicio: Elegir valores iniciales para β, Σ y los valores faltantes en la matriz de datos Y.
Para la iteraci´on l, y durante muchas iteraciones: 1. Tomar β(l) de la distribuci´on Normal dada en (A.1.5). 2. Tomar Σ(l) de la distribuci´on Inversa Wishart dada en (A.1.4). 3. Para cada t = 1, ..., T : a. Denotar a los valores faltantes de Yt por el vector Yt2 b. Tomar Yt2(l) de la distribuci´on Normal dada en (A.1.6), usando los valores corrientes β(l) y Σ(l) . Luego de algunas iteraciones, las muestras obtenidas se pueden considerar valores de las distribuciones de los par´ametros, entre ellos, los valores faltantes.
´ APENDICE B C´odigos en WinBugs A continuaci´on se presentar´an dos c´odigos desarrollados en este trabajo. El primer c´odigo es el implementado IV.3.1, para los 13 a˜nos de estudio y el segundo c´odigo es el caso especial del a˜no 1997.
B.0.7 C´odigo del Modelo IV.3.1 El modelo elegido finalmente result´o ser, como se mencion´o en la conclusi´on, el modelo definido por la verosimilitud: yit ∼ Poiss(Eit eαt +βt .Xit +vit +bit ), es decir, un modelo que incluye el efecto CAR. A continuaci´on se presenta el c´odigo en WinBubs del modelo elegido IV.3.1
#Yi= n´umero de casos de malaria en los municipios 1990 − 2002. #E[i]= es el numero esperado de casos con la enfermead en cada municipio. # b[i] representa el componente CAR. # v[i] es el efecto de heterogeneidad. #X1 y X2 son las matrices de pobreza.
124
125 #X5 representa la matriz de servicio. #X9 es la matriz de m´aximo de precipitaci´on. #i indica los municipios (1, ..., N,N = 15 ) #t representa los a˜nos (1, ..., T , T = 13) model { for (t in 1 : T) # Verosimilitud for(i in 1:N) { Y[i,t] ∼ dpois(mu[i,t]) log(mu[i,t]) < − log(E[i,t] )+alpha0[t]+ alpha1[t]*X1[i,t]+alpha2[t]*X2[i,t]+alpha5[t]*X5[i,t] +alpha9[t]*X9[i,t]+b[i,t]+v[i,t] RR[i,t] < − exp(alpha0[t]+alpha1[t]* X1[i,t]+alpha2[t] * X2[i,t]+alpha5[t]*X5[i,t] +alpha9[t]*X9[i,t]+b[i,t]+v[i,t]) resi[i,t] < − Y[i,t]-mu[i,t] } # Distribuciones a priori: alpha0[t] ∼dflat() alpha1[t] ∼ dnorm(0.0, 1.0E-5) alpha2[t] ∼ dnorm(0.0, 1.0E-5) alpha5[t] ∼ dnorm(0.0, 1.0E-5) alpha9[t] ∼ dnorm(0.0, 1.0E-5) } # distribuci´on CAR b1[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[1]) b2[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[2]) b3[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[3]) b4[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[4]) b5[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[5]) b6[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[6])
126 b7[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[7]) b8[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[8]) b9[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[9]) b10[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[10]) b11[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[11]) b12[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[12]) b13[1 : N] ∼ car.normal(ad j[], weights[], num[], tau.b[13])
for(i in 1:N) { b[i, 1] < −b1[i] b[i, 2] < −b2[i] b[i, 3] < −b3[i] b[i, 4] < −b4[i] b[i, 5] < −b5[i] b[i, 6] < −b6[i] b[i, 7] < −b7[i] b[i, 8] < −b8[i] b[i, 9] < −b9[i] b[i, 10] < −b10[i] b[i, 11] < −b11[i] b[i, 12] < −b12[i] b[i, 13] < −b13[i] } # Distribuci´on a priori para la heterogeneidad for(i in 1:N){ v1[i] ∼ dnorm(0, tau.v[1]) v2[i] ∼ dnorm(0, tau.v[2])
127 v3[i] ∼ dnorm(0, tau.v[3]) v4[i] ∼ dnorm(0, tau.v[4]) v5[i] ∼ dnorm(0, tau.v[5]) v6[i] ∼ dnorm(0, tau.v[6]) v7[i] ∼ dnorm(0, tau.v[7]) v8[i] ∼ dnorm(0, tau.v[8]) v9[i] ∼ dnorm(0, tau.v[9]) v10[i] ∼ dnorm(0, tau.v[10]) v11[i] ∼ dnorm(0, tau.v[11]) v12[i] ∼ dnorm(0, tau.v[12]) v13[i] ∼ dnorm(0, tau.v[13])} for (i in 1:N){ v[i, 1] < −v1[i] v[i, 2] < −v2[i] v[i, 3] < −v3[i] v[i, 4] < −v4[i] v[i, 5] < −v5[i] v[i, 6] < −v6[i] v[i, 7] < −v7[i] v[i, 8] < −v8[i] v[i, 9] < −v9[i] v[i, 10] < −v10[i] v[i, 11] < −v11[i] v[i, 12] < −v12[i] v[i, 13] < −v13[i]} # Pesos for(k in 1:nvecinos){
128 weights[k] < −1} # Distribuciones hiperprioris del par´ametro de precisi´on de los efectos aleatorios. for (i in 1:T){ tau.v[i] ∼ dgamma(0.5, 0.0005) tau.b[i] ∼ dgamma(0.5, 0.0005)} } list(N =15,T=13, Y=structure( .Data=c( 202,80,37,2,29,336,469,396,137,89,155,125,571,202,543,291,81,163,592,446,333,141, 319,580,251,820,202,654,138,43,24,134,770,910,867,953,1381,1598,1350,89,269,86,49,322, 1445,1006,597,440,433,1087,1256,2008,202,41,12,19,40,5,63,244,175,265,1287,682,688,207,329, 206,14,6,6,44,113,18,1,11,7,2,758,2034,364,52,57,272,812,2239,1956,1852,2212,2011,5559,5,1,155, 32,71,101,2,1,417,1,3,1,1,103,212,45,5,2,48,147,261,229,390,573,879,805,450,571,352,72,88,180,257, 600,591,1073,1390,232,1837,202,190,39,2,11,182,48,115,22,19,55,11,10,5,5,155,32,71,7,358,2,417, 494,3,1,1171,183,659,226,20,127,505,674,1231,481,718,1814,833,1516,202,2664,169,42,19,45,258, 505,200,269,858,1020,921,17,115,46,16,29,2,16,60,164,528,846,243,323),
.Dim=c(15, 13)), E=structure( .Data=c( 75.20314,257.563592,70.8638284, 14.5685737, 31.8223879, 115.086417,158.836089,223.218434, 182.096138,213.926566, 351.24183,262.139145,503.439917,61.6516051,212.368726,58.7767799, 12.1536485,26.6992492,97.1178104,134.843836, 190.669725, 156.470205, 184.86888,305.031646, 228.291867,439.685878,140.728488,483.863473,133.651129,27.5819862,60.4891096,219.583215, 304.28401, 429.312503, 351.627502, 414.565993, 683.347905,511.494206,985.346054,92.0013969, 316.959032, 87.7289757,18.1422837, 39.8616266, 144.994395, 201.238781, 284.457378, 233.363514, 275.658289, 455.214744, 342.345084,662.587357,360.425526,1250.06577, 348.258663, 72.474308, 160.213394,586.269817, 818.950606, 1164.67647, 961.360263, 1142.24986,1897.62416,1428.73033,
129 2768.39256,53.5430074, 185.7637,51.7699293,10.7792905, 23.838222, 87.262618, 121.892386, 173.325695,143.060025,169.995622,282.104286, 212.442659, 411.766362,64.3435282, 219.946106, 60.3951682, 12.3964054,27.0310623, 97.574345,134.41394,188.530373, 153.476377, 179.86581, 294.663977, 219.892769, 422.305927,88.7251295, 307.753918, 85.7437527, 17.8426307,39.4499581, 144.344329, 201.552673, 286.587179,236.481439, 280.915138, 466.796912, 351.867698, 682.591866, 41.1897066, 137.201108,36.7050463,7.33264858,15.5497793,54.5955828, 73.0890301, 99.4989579, 78.6306603, 89.3392435, 141.326146, 103.483441, 195.002629,78.9390041,268.362763, 73.2960348, 14.9579962, 32.4405791, 116.495719, 159.5867, 222.654944, 180.320006,210.219581, 343.110615, 253.467348, 481.906138,52.6074, 175.615622, 47.0812272, 9.42389796, 20.0423355,70.5395572, 94.7066239, 129.383028, 102.596802, 117.010209, 186.203343, 137.025297, 259.500638,166.314889, 567.663692, 155.688953, 31.898507, 69.452193, 250.369527, 344.462164, 482.662588, 392.633647, 459.874594, 753.477783, 561.659732, 1077.49492,168.29772, 579.652792, 160.393068, 33.1565439, 72.8212659, 264.814877,367.41721, 519.098422, 425.728639, 502.645406, 829.606099, 617.890062, 1184.37852,878.088907, 3054.68355,853.408511, 178.083666, 394.668929, 1447.90443, 2027.37273, 2890.17826, 2391.23144, 2847.43574, 4742.23125, 3531.61378, 6768.11638,100.940551, 349.536157, 97.2389335, 20.2076138, 44.6199086, 163.047361, 227.353217, 322.746044, 265.92334, 315.429071, 523.019302, 387.656585, 739.484854),
.Dim=c(15,13)), X1=structure( .Data=c( 16.0219182,16.0219182, 16.0219182, 16.0219182, 16.0219182, 16.0219182, 16.0219182, 6.27826107,6.27826107, 6.27826107, 6.27826107,6.27826107,6.27826107,-19.5077925,-19.5077925, -19.5077925,-19.5077925,-19.5077925,-19.5077925,-19.5077925, -18.0776329,-18.0776329,-18.0776329,18.0776329,-18.0776329,-18.0776329,-10.0776915,-10.0776915,-10.0776915, -10.0776915,-10.0776915,10.0776915,-10.0776915,-3.37939193,-3.37939193,-3.37939193,-3.37939193,-3.37939193, -3.37939193,8.33286071,-8.33286071,-8.33286071,-8.33286071,-8.33286071,-8.33286071,-8.33286071, -21.7534289,-21.7534289, -21.7534289,-21.7534289,-21.7534289, -21.7534289,7.78995109, 7.78995109,
130 7.78995109, 7.78995109, 7.78995109, 7.78995109, 7.78995109, 16.5094891, 16.5094891, 16.5094891, 16.5094891, 16.5094891, 16.5094891,-2.51676201, -2.51676201, -2.51676201, -2.51676201,-2.51676201,2.51676201, -2.51676201, 4.59171807, 4.59171807, 4.59171807, 4.59171807, 4.59171807, 4.59171807, 0.34082029, 0.34082029, 0.34082029, 0.34082029, 0.34082029, 0.34082029, 0.34082029, -8.91647793, -8.91647793, -8.91647793,-8.91647793,-8.91647793, -8.91647793,25.3255538, 25.3255538, 25.3255538, 25.3255538, 25.3255538, 25.3255538, 25.3255538, 20.6429991, 20.6429991, 20.6429991, 20.6429991, 20.6429991, 20.6429991, 6.73198789, 6.73198789, 6.73198789,6.73198789, 6.73198789,6.73198789, 6.73198789, 11.7494551, 11.7494551, 11.7494551, 11.7494551, 11.7494551, 11.7494551, 15.8313262, 15.8313262, 15.8313262, 15.8313262, 15.8313262, 15.8313262, 15.8313262, 7.08736707, 7.08736707, 7.08736707, 7.08736707, 7.08736707, 7.08736707,-37.8233007,-37.8233007,-37.8233007,-37.8233007, 37.8233007,-37.8233007,-37.8233007,-18.2873699,-18.2873699, -18.2873699,-18.2873699,-18.2873699,18.2873699,-26.3800549,-26.3800549,-26.3800549,-26.3800549,-26.3800549,-26.3800549, -26.3800549,8.00348793,-8.00348793,-8.00348793,-8.00348793,-8.00348793,-8.00348793, -3.86160091, -3.86160091, -3.86160091, -3.86160091, -3.86160091, -3.86160091, -3.86160091,-8.18869993,-8.18869993,-8.18869993,8.18869993, -8.18869993, -8.18869993,11.6180293, 11.6180293, 11.6180293, 11.6180293, 11.6180293, 11.6180293, 11.6180293, 18.1839011, 18.1839011, 18.1839011, 18.1839011, 18.1839011, 18.1839011, 24.8404765, 24.8404765, 24.8404765, 24.8404765, 24.8404765, 24.8404765, 24.8404765, 1.56329907, 1.56329907, 1.56329907, 1.56329907, 1.56329907, 1.56329907),
.Dim=c(15,13)), X2=structure( .Data=c( 0.1553328, 0.1553328, 0.1553328, 0.1553328, 0.1553328, 0.1553328, 0.1553328, -10.52104845, -10.52104845, -10.52104845, -10.52104845, -10.52104845, -10.52104845,-4.830715, -4.830715, -4.830715, -4.830715, -4.830715, -4.830715, -4.830715, -0.877507683, -0.877507683, -0.877507683, -0.877507683, -0.877507683, -0.877507683,-11.7852128, -11.7852128, -11.7852128, -11.7852128, -11.7852128, -11.7852128, -11.7852128, 6.192202699, 6.192202699, 6.192202699, 6.192202699, 6.192202699, 6.192202699,22.298461, 22.298461, 22.298461, 22.298461,
131 22.298461, 22.298461, 22.298461, -3.656395241, -3.656395241, -3.656395241, -3.656395241, -3.656395241,-3.656395241,-14.5313599, -14.5313599, -14.5313599, -14.5313599, -14.5313599, -14.5313599, -14.5313599, 9.924840602, 9.924840602, 9.924840602, 9.924840602, 9.924840602, 9.924840602, 14.9866493, 14.9866493, 14.9866493, 14.9866493, 14.9866493, 14.9866493, 14.9866493, 1.946808733, 1.946808733,1.946808733, 1.946808733, 1.946808733, 1.946808733, 8.4031009, 8.4031009, 8.4031009, 8.4031009, 8.4031009, 8.4031009, 8.4031009, -9.167817183, -9.167817183, -9.167817183, -9.167817183, -9.167817183, -9.167817183, -6.3339579, -6.3339579, -6.3339579, -6.3339579, -6.3339579, -6.3339579, -6.3339579, -8.73570153, -8.73570153, -8.73570153, -8.73570153, -8.73570153, -8.73570153,-19.6218785, -19.6218785, -19.6218785, -19.6218785, -19.6218785, -19.6218785, -19.6218785, -13.50182688, -13.50182688, -13.50182688, -13.50182688, -13.50182688, 13.50182688,-13.5919741, -13.5919741, -13.5919741, -13.5919741, -13.5919741, -13.5919741, -13.5919741, -11.5684366, -11.5684366, -11.5684366, -11.5684366, -11.5684366, -11.5684366, -4.2282733, -4.2282733, -4.2282733, -4.2282733, -4.2282733, -4.2282733, -4.2282733, 3.696550793, 3.696550793, 3.696550793, 3.696550793, 3.696550793, 3.696550793, -0.9193651, -0.9193651, -0.9193651, -0.9193651, -0.9193651, -0.9193651, -0.9193651, 13.04738306, 13.04738306, 13.04738306, 13.04738306, 13.04738306, 13.04738306, 11.6101613, 11.6101613, 11.6101613, 11.6101613, 11.6101613, 11.6101613, 11.6101613, 3.498930874, 3.498930874, 3.498930874, 3.498930874, 3.498930874, 3.498930874, -2.262437, -2.262437, -2.262437, -2.262437, -2.262437, -2.262437, -2.262437, 19.72518568, 19.72518568, 19.72518568, 19.72518568, 19.72518568, 19.72518568, 20.6514682, 20.6514682, 20.6514682, 20.6514682, 20.6514682, 20.6514682, 20.6514682, -0.00316887, -0.00316887, -0.00316887, -0.00316887, -0.00316887, -0.00316887),
.Dim=c(15,13)), X5=structure( .Data=c( 11.5306599, 11.5306599, 11.5306599, 11.5306599, 11.5306599, 11.5306599, 11.5306599, 11.5306599, 11.5306599, 11.5306599, 11.5306599, 11.5306599, 11.5306599, 19.0374569, 19.0374569, 19.0374569,
132 19.0374569, 19.0374569, 19.0374569, 19.0374569, 19.0374569, 19.0374569, 19.0374569, 19.0374569, 19.0374569, 19.0374569, 14.2066859, 14.2066859, 14.2066859, 14.2066859, 14.2066859, 14.2066859, 14.2066859, 14.2066859, 14.2066859, 14.2066859, 14.2066859, 14.2066859, 14.2066859, 27.6779749, 27.6779749, 27.6779749, 27.6779749, 27.6779749, 27.6779749, 27.6779749, 27.6779749, 27.6779749, 27.6779749, 27.6779749, 27.6779749, 27.6779749, -36.7514781, -36.7514781, -36.7514781, -36.7514781, -36.7514781, -36.7514781, -36.7514781, -36.7514781, -36.7514781, -36.7514781, -36.7514781, -36.7514781, -36.7514781, -28.0545821, -28.0545821, -28.0545821, -28.0545821, -28.0545821, -28.0545821, -28.0545821, -28.0545821, -28.0545821, -28.0545821, -28.0545821, -28.0545821, -28.0545821, 27.6930729, 27.6930729, 27.6930729, 27.6930729, 27.6930729, 27.6930729, 27.6930729, 27.6930729, 27.6930729, 27.6930729, 27.6930729, 27.6930729, 27.6930729, -2.35360607, -2.35360607, -2.35360607, -2.35360607, -2.35360607, -2.35360607, -2.35360607, -2.35360607, -2.35360607, -2.35360607, -2.35360607, -2.35360607, -2.35360607, 5.53422193, 5.53422193, 5.53422193, 5.53422193, 5.53422193, 5.53422193, 5.53422193, 5.53422193, 5.53422193, 5.53422193, 5.53422193, 5.53422193, 5.53422193, 12.1747589, 12.1747589, 12.1747589, 12.1747589, 12.1747589, 12.1747589, 12.1747589, 12.1747589, 12.1747589, 12.1747589, 12.1747589, 12.1747589, 12.1747589, -4.14509207, -4.14509207, -4.14509207, -4.14509207, -4.14509207, -4.14509207, -4.14509207, -4.14509207, -4.14509207, -4.14509207, -4.14509207, -4.14509207, -4.14509207, 4.76763893, 4.76763893, 4.76763893, 4.76763893, 4.76763893, 4.76763893, 4.76763893, 4.76763893, 4.76763893, 4.76763893, 4.76763893, 4.76763893, 4.76763893, -6.50910507, -6.50910507, -6.50910507, -6.50910507, -6.50910507, -6.50910507, -6.50910507, -6.50910507, -6.50910507, -6.50910507, -6.50910507, -6.50910507, -6.50910507, -36.5935641, -36.5935641, -36.5935641, -36.5935641, -36.5935641, -36.5935641, -36.5935641, -36.5935641, -36.5935641, -36.5935641, -36.5935641, -36.5935641, -36.5935641, -8.21504307, -8.21504307, -8.21504307, -8.21504307, -8.21504307, -8.21504307, -8.21504307, -8.21504307, -8.21504307, -8.21504307, -8.21504307, -8.21504307, -8.21504307),
.Dim=c(15,13)), X9=structure( .Data=c(
133 -0.484661807, -0.14119412, -0.077914553, -0.304681807, -0.096134853, -0.402087993, -0.151739567, 0.34238214, -0.16521736, -0.194733473, -0.485871467, 0.4669182, -0.905638333, -0.478514507, 0.19517058, 0.061187547, -0.041565207, 0.013025147, -0.515246493, -0.163624667, 0.03639526, 0.07255914, 0.228029527, 0.411642433, -0.1294788, -0.729047333, -0.342513607, -0.19966342, -0.004605853, 0.026858093, -0.012498953, -0.584740193, 0.382180333, -0.01227234, -0.04349976, -0.224996273, -0.367559867, -0.0279638, 0.211068667, 0.757308693, -0.09906202, -0.017547153, 0.200109093, -0.041816253, 1.439232607, 0.299845433, 0.22374636, 0.14124344, 0.674149327, 1.571581433, -0.2722288, 1.401866667, -0.590802107, 0.07362958, -0.051660953, -0.183372007, -0.147876453, -0.651244493, -0.286246767, -0.30548504, -0.05752116, -0.150063873, -1.033414267, 0.7007018, -1.224522333, -0.515517507, 0.07745538, 0.001945247, 0.053589493, 0.028045147, -0.571616493, -0.061407567, 0.11243946, -0.02492766, 0.048158627, 0.316689533, 0.6856792, 1.216017667, -0.431276007, 0.23259448, -0.054098853, 0.171203393, 0.119213647, -0.563226293, -0.061928967, 0.17819576, 0.45464384, -0.054268673, -0.467881367, -1.5212888, -0.145940333, 0.508989493, -0.10067012, -0.067128753, 0.058531293, -0.082142153, 0.230706007, -0.063870767, 0.20884636, -0.18982456, 0.109164027, 0.802693733, -0.0758738, -0.275928333, -0.479454307, 0.43669798, 0.018191147, 0.143826993, -0.029818153, -0.676217893, -0.202482967, 0.23968896, 0.33066614, 0.146084127, -0.331980867, -1.3096858, -1.524169333, -0.010449107, 0.04074658, 0.044687847, 0.103337293, 0.157552147, -0.523673393, -0.213208867, 0.02374746, 0.29898294, -0.234586773, -0.834079867, 0.0534202, 1.576577667, 0.178051193, -0.24539612, -0.089567453, -0.039375907, -0.012100753, 0.764545007, 0.190965233, -0.04769164, -0.07668816, 0.189761427, 0.781864533, -0.0117098, -0.219353333, 0.908282193, -0.10137202, -0.113319453, -0.100442507, 0.083490147, 1.026963707, 0.406755333, -0.29748324, -0.40571236, -0.307167373, -0.013305067, -0.9361278, -0.578781333, -0.248448907, -0.23160242, -0.075733453, -0.133696307, -0.018691453, -0.014103393, 0.052169233, -0.04060754, -0.07967666, -0.152835273, 0.647904533, 2.6521352, 1.223140667, 1.243830393, 0.24525898, 0.293539247, 0.116345293, 0.002432047, 1.661309007, 0.206949033, 0.20476136, -0.15269856, 0.335807127, 0.185073233, 0.0840052, 0.057484667, -0.014824107, -0.18259332, 0.132025447, -0.070667207, 0.037320747, -0.620599693, -0.334354467, -
134 0.18189904, -0.10232926, -0.412502473, -1.183356667, 1.0429012, -0.082775333),
.Dim=c(15,13)), num = c(3, 3, 6, 5, 3, 3, 3, 1, 3, 3, 3, 4, 4, 2, 2), adj = c( 13,2,4, 1,4,5, 5,4,9,7,10,15, 1,2,5,3,9, 2,4,3, 14,12,11, 9,3,10, 13, 4,3,7, 15,3,7, 6,12,13, 14,6,11,13, 8,11,12,1, 6,12, 3,10
), nvecinos = 48)) Valores Iniciales 1 list( alpha0=c(0.42108683742665, -0.0115702954315979, 0.220318397433863, -5.84295379944429, 0.0483185170328542, -0.174475880215053, 0.0868413255066389, 0.241223543332645, -0.0250410146960307, 0.134095825597840, 0.330697628906357, 0.270874241833351, 0.146357031303002),
alpha1=c(0.00274684714936346,0.000583782730090218,0.00631591020210962,-0.133568605933697, -0.004335031953319,-0.0137733817655218,-0.00676650975633135,-0.0158124039335976, 0.0420410134887794,-0.0216216330433192,-0.0459708183455205,-0.00439410598017391,
135 0.00141369159417196),
alpha2=c(0.00622601195338316,0.0252043035578152,-0.00464003880449156, 0.368291115766039, 0.0204509440966138,0.0345819442515732, 0.00540728631000681,-0.0526258250564626, 0.0218084190809949,-0.0492696745312297,-0.0608627569135842,-0.0267487069637765, -0.0347608603145790),
alpha5=c(0.0337256972883773,0.0292758001995859,0.0405147333246352,0.0954814249857646, 0.0514375707395178,0.0596844308670028,0.0560329880761708,0.0252054889578227, 0.0716875680580359,0.0377082891329944,0.00404229292774238,0.0295632483115302, 0.0513493133301615),
alpha9=c(-1.10350033568225,3.71250328397681,-0.311826117173991,-22.5957890534441, -1.95870613664451,-0.106637078778266,-0.28251725106111,0.880370233093662, 1.95822649906047,-1.70792829540558,-0.548637153279689,-0.27080297195617, -0.0561800990740839),
tau.v=c(2,2,2,2,2,2,2,2,2,2,2,2,2), tau.b=c(1,1,1,1,1,1,1,1,1,1,1,1,1), v1=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v2=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v3=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v4=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v5=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v6=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v7=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v8=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v9=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v10=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v11=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v12=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), v13=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b1=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b2=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b3=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b4=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b5=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b6=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b7=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b8=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b9=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b10=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b11=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0),
136 b12=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b13=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0) ) Valores Iniciales 2
list( alpha0=c(0.52108683742665,0.0884297045684021,0.320318397433863,-5.74295379944429, 0.148318517032854,-0.0744758802150529,0.186841325506639,0.341223543332645, 0.0749589853039693,0.234095825597840,0.430697628906357,0.370874241833351, 0.246357031303002),
alpha1=c(0.102746847149363,0.100583782730090,0.106315910202110,-0.0335686059336969, 0.095664968046681,0.0862266182344782,0.0932334902436687,0.0841875960664024, 0.142041013488779,0.0783783669566808,0.0540291816544795,0.095605894019826, 0.101413691594172),
alpha2=c(0.106226011953383,0.125204303557815,0.0953599611955084,0.468291115766039, 0.120450944096614,0.134581944251573,0.105407286310007,0.0473741749435375, 0.121808419080995,0.0507303254687703,0.0391372430864158,0.0732512930362235, 0.065239139685421),
alpha5=c(0.133725697288377,0.129275800199586,0.140514733324635,0.195481424985765, 0.151437570739518,0.159684430867003,0.156032988076171,0.125205488957823, 0.171687568058036,0.137708289132994,0.104042292927742,0.129563248311530,0.151349313330161),
alpha9=c(-1.00350033568225,3.81250328397681,-0.211826117173991,-22.4957890534440, -1.85870613664451,-0.00663707877826625,-0.18251725106111,0.980370233093662, 2.05822649906047,-1.60792829540558,-0.448637153279689,-0.17080297195617, 0.0438199009259161),
tau.v=c(1,1,1,1,1,1,1,1,1,1,1,1,1), tau.b=c(1,1,1,1,1,1,1,1,1,1,1,1,1), v1=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), v2=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), v3=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), v4=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1),
137 v5=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), v6=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), v7=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), v8=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), v9=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), v10=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), v11=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), v12=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1), v13=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b1=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b2=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b3=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b4=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b5=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b6=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b7=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b8=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b9=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b10=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b11=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b12=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0), b13=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0))
B.0.8 C´odigo del Modelo IV.5.1 El siguiente c´odigo realizado en WinBugs fu´e utilizado para estudiar el caso especial IV.5.1 para el a˜no 1997. #Yi = n´umero de casos de malaria en los 15 municipios en 1997. #Ei = es el n´umero esperado de casos con la enfermead en cada municipio. # b[i] representa el componente CAR. # v[i] es el efecto de heterogeneidad. model { # Verosimilitud for(i in 1 : N) { Y[i]∼ dpois(mu[i]) log(mu[i])< − log(E[i] )+alpha0 + alpha1 ∗ X1[i] + alpha2 ∗ X2[i] + alpha5 ∗ X5[i] + alpha9 ∗ X9[i] + b[i] + v[i] RR[i] < − exp(alpha0+alpha1∗ X1[i]+alpha2∗ X2[i]+alpha5∗ X5[i]+alpha9∗ X9[i]+b[i]+v[i]) v[i]sim dt(1, tau.v, 2)
138 resi[i] < − Y[i]-mu[i] # CAR prior distribution for random effects: b[1 : N] ∼ car.normal(ad j[], weights[], num[], tau) for(k in 1:nvecinos) weights[k] < −1 } # Distribuciones a priori: alpha0 ∼ dflat() alpha1 ∼ dnorm(0.0, 1.0E − 5) alpha2 ∼ dnorm(0.0, 1.0E − 5) alpha5 ∼ dnorm(0.0, 1.0E − 5) alpha9 ∼ dnorm(0.0, 1.0E − 5) tau.v ∼ dgamma(0.5, 0.0005) tau ∼ dgamma(0.5, 0.0005) list(N = 15, Y = c(396, 333, 910, 597, 244, 113, 2239, 1, 261, 600, 115, 2, 1231, 505, 60), E = c(223.218434, 190.669725, 429.312503, 284.457378, 1164.67647, 173.325695, 188.530373, 286.587179, 99.4989579, 222.654944, 129.383028, 482.662588, 519.098422, 2890.17826, 322.746044), X1 = c(6.27826107, −18.0776329, −3.37939193, −21.7534289, 16.5094891, 4.59171807, −8.91647793, 20.6429991, 11.7494551, 7.08736707, −18.2873699, −8.00348793, −8.18869993, 18.1839011, 1.56329907), X2 = c(−10.5210485, −0.87750768, 6.1922027, −3.65639524, 9.9248406, 1.94680873, −9.16781718, −8.73570153, −13.5018269, −11.5684366, 3.69655079, 13.0473831, 3.49893087, 19.7251857, −0.00316887), X5 = c(11.5306599, 19.0374569, 14.2066859, 27.6779749, −36.7514781, −28.0545821, 27.6930729, −2.35360607, 5.53422193, 12.1747589, −4.14509207, 4.76763893, −6.50910507, −36.5935641, −8.21504307),
139 X9 = c(−0.784701, 2.286845, −0.005398014, 2.286845, −2.321633, −0.005398014, 1.68575, −1.409788, −0.6064938, −1.409788, 1.68575, 0.619689, 1.084654, −2.964805, −0.1415288), num = c(3, 3, 6, 5, 3, 3, 3, 1, 3, 3, 3, 4, 4, 2, 2), adj = c( 13,2,4, 1,4,5, 5,4,9,7,10,15, 1,2,5,3,9, 2,4,3, 14,12,11, 9,3,10, 13, 4,3,7, 15,3,7, 6,12,13, 14,6,11,13, 8,11,12,1, 6,12, 3,10
), nvecinos = 48)) Valores Iniciales 1 list(alpha0 = 0.0115702954, alpha1 = 0.0005837827, alpha2 = 0.0252043036, alpha5 = 0.0292758002, alpha9 = 3.7125032840, b = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0)) Valores Iniciales 2 list(alpha0 = 0.1115702954, alpha1 = 0.1005837827, alpha2 = 0.1252043036, alpha5 = 0.1292758002, alpha9 = 3.8125032840, b = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1))
UNIVERSIDAD SIMON BOLIVAR DECANATO DE ESTUDIOS DE POSTGRADO
NOMBRE DEL ESTUDIANTE: TITULO DE LA TESIS:
DESIREE EGLEE VILLALTA
MODELAJE BAYESIANO ESPACIO-TEMPORAL DE LA INCIDENCIA DE LA MALARIA EN EL ESTADO SUCRE-VENEZUELA
NOMBRE DEL ASESOR:
LELYS BRAVO
MIEMBROS DEL JURADO: PALABRAS CLAVES: SOBRESALIENTE: Nº DE PAGS:
ISABEL LLATAS Y YASMIN RUBIO
MALARIA, ESTADO SUCRE, MODELOS BAYESIANOS JERARQUICOS, REGRESION LOG-POISSON , MODELOS AREALES NO GRADUADO CON HONORES: NO
155
FECHA DE GRADUACIÓN: NOVIEMBRE
MAESTRÍA EN: ESTADISTICA RESUMEN
En el presente trabajo se presenta un modelo areal Bayesiano jerárquico de regresión log- Poisson espacio-temporal para modelar la incidencia de la malaria en el Estado Sucre-Venezuela, durante el período 1990 - 2002 en los 15 municipios del estado. Mediante la implementación de códigos en el software WinBUGS, se selecciona un modelo que incluye covariables climáticas y socio-económicas, donde el efecto CAR está presente. Para el proceso de selección de modelos se utiliza el criterio de la Mínima Perdida Predictiva a Posteriori (D). Se prueba la independencia de los residuales del modelo resultante utilizando el estadístico I de Morán; se verifica el ajuste del modelo mediante el p-bayesiano, concluyéndose que las covariables de agricultura, máximo de precipitación y pobreza influyen en la propagación del mosquito para los años de estudio. Se presenta un caso especial para el año 1997 donde se ajusta el modelo mediante una distribución de colas pesadas. Palabras Claves: Malaria, estado Sucre, modelos bayesianos jerárquicos, regresión log-Poisson, modelos areales.