Restauración de Imágenes de Satélite Utilizando estadísticas espaciales. Rafael Rebolledo-Wueffer [1],
[email protected] 1
FUNDACIÓN INSTITUTO DE INGENIERÍA PARA INVESTIGACIÓN Y DESARROLLO TECNOLÓGICO CENTRO DE PROCESAMIENTO DIGITAL DE IMÁGENES Y UNIVERSIDAD SIMÓN BOLÍVAR VENEZUELA
RESUMEN Elementos indeseables en la interpretación tales como la presencia de nubes, constituye uno de los casos de vacío de información más comunes en la percepción remota; estos vacíos han representado desde siempre una de las dificultades más comunes en el proceso de observación y análisis de imágenes de satélite. Otro Problema común en Geomática es la verosimilitud de superficies funcionales que representan la distribución espacial de variables continuas; los procesos de interpolación como mínimos cuadrados, kriggin y splines, han ofrecido cada vez mas, mejores aproximaciones a estas realidad tan compleja; sin embargo cuando los datos puntuales están tan dispersos, se generan también vacíos de información que inciden en los resultado de estos métodos, afectando la verosimilitud de estas representaciones. En el campo del procesamiento digital de imágenes se han desarrollado alternativas que buscan solventar eventualidades como estas. Estas alternativas se conocen como procesos de restauración; la mayoría de ellos componen imágenes sintéticas a partir de información de tomas pasadas, o de restitución de datos faltantes. Este trabajo representa una alternativa diferente que plantea la restauración a partir de la misma imagen, esto tiene la ventaja de que no se introducen errores temporales, pues es la realidad instantánea de la escena lo que se analiza. Desde los inicios de la Imagenología, la estadística ha estado unido al procesamiento digital de imágenes, en las imágenes de satélite se ha utilizado en algoritmos de clasificación, mejoramiento de contrastes, filtrado, superficies funcionales , etc. Sin embargo esta propuesta tiene un objetivo diferente: la restauración artificial de imágenes, por medio de estimaciones basada en estadística espacial; entendiendo al píxel como la realización de una variable de estudio y tratándolo como tal. Esto hace posible entre otras cosas: 1. Filtrar la presencia de nubes en una imagen, sin necesidad de sintetizar con otras imágenes. 2. Afinar modelos de superficie climáticas de temperatura con data de tierra a partir de la calibración e integración a Imágenes temporalmente compatibles captadas en el TIR.
Palabras Clave: Geoestadística, Modelos Predictivos, Interpolación
I.- METODOLOGIA La idea de esta propuesta es descomponer la imagen en varias sub imágenes tomaremos una imagen de satélite y la descompondremos en cuatro secuencias espaciales, es decir cada una de ellas tendrá la cuarta parte de la información sobre lo que muestra la imagen. Estadísticamente hablando, cada píxel de cada secuencia espacial (diferente de cero) representará una realización de la variable, solo que captada a distancia, la descomposición en cuatro secuencias hará que cada píxel este separado por una distancia equivalente a tres píxeles de su próxima realización (ver figura 1).
Imagen Original
Seccionamiento
Muestra 1
Muestra 2
Muestra 3
Análisis Estadístico de los Datos
NO
Transformación
¿Normalidad? SI Análisis de Varianza
Selección Modelo y orden
GLS
Imagen 1
Imagen 2
KRIGING
Imagen 3
Análisis de Varianza
RESULTADOS Figura 1: Modelo conceptual de la Propuesta
De este modo, considerando independientemente las distintas secuencias espaciales, donde cada píxeles será una suerte “pseudo-estación” con una realización espacial y el conjunto de píxeles de esta sub-imagen seria equivalente a una red de pseudo-estaciones
de tierra altamente densificada. la idea es tratar por estimación estadística-espacial de recomponer lo mejor posible la imagen original. Si el proceso de precomposición resulta, (o sea, si por procedimientos de estación estadística se logra recomponer la imagen original a partir de sus secuencias) se puede decir que, en efecto, la información de los píxeles de una imagen de satélite se puede constituir en “pseudo-realizaciones” de la variable representada en la imagen, por lo que los procedimientos como este serian compatibles con la restauración sintética. Para Evaluar este procedimiento y comprobar esta teoría, tomaremos una imagen de NDVI; el NDVI es un índice que utiliza las bandas roja e infrarroja, según la siguiente proporción:
NDVI =
IR − R IR + R
Donde:
IR es la respuesta espectral del sensor en la banda de absorción del Infrarojo. R es la respuesta espectral en la banda de absorción de del Rojo.
Si bien el NDVI es un índice, se puede decir que caracteriza fielmente la vegetación que es una variable ambiental directa.
Figura 2: Área de estudio.
El área de estudio la constituye un sector de una imagen Landsat tomada el 20 de febrero de 1985 de la escena 006 055 Entre el estado Apure y Barinas. De ese sector de la imagen se seleccionó una porción pequeña pero suficientemente representativa de un lote boscoso montañoso, tal como se muestra en la figura 3. De ese lote se determinaron los valores de NDVI.
Los valores de NDVI varían entre -1 y 1, en la medida que se acercan mas a 1 es mayor presencia de vegetación vigorosa; por el contrario cuando se acerca a -1 representa suelos ralos de escasa vegetación. La figura que se muestra a continuación representa los valores de NDVI para el área de estudio.
Figura 3: Imagen de NDVI
Digitalmente hablando esta imagen es una matriz constituida por píxeles de 30 x 30m, donde cada píxel indica el valor correspondiente de NDVI de una parcela de 30x30m donde en el lugar geográfico que indica la imagen. En ese sentido, se puede convertir la imagen constituida por píxeles en una cobertura de puntos ubicados al centro de cada píxel, estos puntos conservaran la información del NDVI como su atributo. Una vez convertida en puntos la información puede ser segmentada tal como se comentó al principio, esto se puede entender con la siguiente analogía: supongamos que la imagen esta compuesta de cubitos y se le hace pasar por dos tamices desplazados entre sí, con mayas cuyo tamaño es similar y exacto el de cada cubito. El paso de la imagen por estos tamices generaría tres sub-imagenes: la que queda en la malla 1(muestra1), la que pasa la malla 1 pero queda en la malla 2 (muestra 2) y la que queda en el fondo (muestra 3).
Figura 4: Descomposición pixelar de la imagen
Muestra 1 (puntos azules)
Muestra (puntos rojos)
Muestra 3 (puntos magenta)
Figura 5: Seccionamiento de la imagen (conversión a puntos)
II.- ANÁLISIS DE LOS DATOS: Todo el análisis estadístico de los datos se hizo en R Statistical. El diagrama de dispersión general, permite una visualización integral de los datos, sirve en particular como elemento de control pues sirve entre otras cosas para verificar que las dispersiones cruzadas sean iguales además en el caso particular de las dispersiones XY y YX, deben reflejar una forma similar al área de estudio como efectivamente ocurre. Analizando el conjunto de ploteos generales (muestra 1, 2 y 3) es evidente el grado de similitud entre cada set de datos (ver figura 7).
MUESTRA 1
MUESTRA 2
MUESTRA 3
Figura 6: diagrama de dispersión general para cada muestra
Tal como se muestra en los diagramas de dispersión acumulada de las tres muestras, existe mucha similitud en la forma como se distribuyen los datos, siendo un lote boscoso, la mayoría de los datos se sitúa entre 0.3 y 0.5 NDVI, que es propio de bosques de densidad media. En el caso de los histogramas de frecuencia se observa una distribución casi normal algo asimétrica hacia la derecha. (ver figura 7).
Figura 7: Diagrama de frecuencia acumulada e histograma de frecuencias.
El diagrama de caja y bigotes y la curva de cuantíles teóricos/maestrales, demuestran la similitud entre las muestras; pero mas allá de ello, indican la buena relación de “normalidad” de cada una de las muestras, pues en el caso de los diagrama de caja son pocos los punto en condición de rareza y en el caso de las curva de cuantíles, se ajusta muy bien a una recta de pendiente 1; esto es suficiente argumento para indicar que la
distribución de cada una de las muestras es una distribución normal; por lo que es posible hacer estimaciones paramétricas, sin recurrir a funciones de transformación (ver figura 8).
Figura 8: Diagramas de caja e Q-Q Plot para cada muestra.
III.- AJUSTE DE MODELOS PREDICTIVOS Una vez verificada la normalidad, el objetivo siguiente es el ajuste de modelos de predicción basados en funciones paramétricas de diverso orden. El modelo de predicción basado en ajuste por Mínimos Cuadrados Ordinarios (OLS) se descarta de plano para este trabajo dado que considera independencia espacial en los errores. Sin embargo es necesario hacer el análisis para hacer el ajuste por Mínimos Cuadrados Generalizados (GLS) y por Kringing. Además es necesario para determinar el orden de la función paramétrica que mejor describe la composición de cada muestra. Selección del Orden de la Función Paramétrica: La mejor manera de seleccionar adecuadamente el Orden de la función de ajuste que mejor representa la composición de cada una de las muestras es el análisis de varianza o estudio de los estadísticos. El resumen de los estadísticos de la salida de Kriging no muestra valores del análisis de varianza, esto se debe a que la salida efectivamente es la evaluación de la función de predicción en un espacio geográfico, no una función de estimación como tal; sin embargo, la función de Kriging usa como entrada la salida del ajuste por mínimos cuadrados generalizados. En este sentido para efectos de este trabajo tomaremos los mínimos cuadrados ponderados como base para efectuar la sección del orden mas adecuado para la función paramétricas de ajuste. Con los estadísticos de las funciones de ajuste para el caso de las salida del ajuste por mínimos cuadrados ponderados se reportan tres parámetros que para este caso, pueden servir para verificar la calidad del proceso de ajuste, estos parámetros son: Los residuales, el valor F , y el criterio de información de Akaike (AIC). La prueba significancia y el criterio de los grados de libertad no aplican dando la cantidad de datos es suficiente. De acuerdo a la salida de R los estadísticos para cada muestra son los siguientes:
Criterio de aceptación
Residuales
F Value
AIC
Mínimo
Mínimo
Mínimo relativo
Como se observará en las tres paginas siguientes las estimaciones de orden 3 y de orden seis son las que mejor se amoldan a estos criterios, tanto para la muestra 1 como para las muestras 2 y 3. En consecuencia en adelante solo se consideraran estas órdenes para el trabajo.
MUESTRA 1 > summary(m1gls2) Analysis of Variance Table Model: surf.gls(np = 2, covmod = expcov, x = m1df, d = 70) Sum Sq Df Mean Sq F value Regression 0.2450240 5 0.049004805 0.004543491 Deviation 8.4917856 1869 Total 8.7368096 1874 Multiple R-Squared: 0.02805, Adjusted R-squared: 0.02544 AIC: (df = 6) -10107.87 Fitted: Min 1Q Median 0.2482 0.2919 0.3015 Residuals: Min 1Q Median -0.27478 -0.02746 0.01654 0.05859
Pr(>F) 10.78572
3Q 0.3181 3Q
> summary(m1gls4) Analysis of Variance Table Model: surf.gls(np = 4, covmod = expcov, x = m1df, d = 50) Sum Sq Df Mean Sq F value Regression 0.9732813 14 0.06952009 Deviation 7.7635283 1860 0.00417394 Total 8.7368096 1874 Multiple R-Squared: 0.1114, Adjusted R-squared: 0.1047 AIC: (df = 15) -10257.99 Fitted: Min 1Q Median 0.2285 0.2907 0.3071 Residuals: Min 1Q Median -0.30117 -0.03059 0.01131 0.05174 0.17609 > summary(m1gls5) Analysis of Variance Table Model: surf.gls(np = 5, covmod = expcov, x = m1df, d = 40) Sum Sq Df Mean Sq F value Regression 1.211542 20 0.060577125 0.004058936 Deviation 7.525267 1854 Total 8.736810 1874 Multiple R-Squared: 0.1387, Adjusted R-squared: 0.1294 AIC: (df = 21) -10304.43 Fitted: Min 1Q Median 0.2083 0.2918 0.3092 Residuals: Min 1Q Median -0.300449 -0.033029 0.008338
Muestra1 modelo ls2do ls3er ls4to ls5to ls6to
Fvalue
Max 0.3746 Max
0.18225
> summary(m1gls3) Analysis of Variance Table Model: surf.gls(np = 3, covmod = expcov, x = m1df, d = 60) Sum Sq Df Mean Sq F value Regression 0.3688796 9 0.040986627 Deviation 8.3679299 1865 0.004486826 Total 8.7368096 1874 Multiple R-Squared: 0.04222, Adjusted R-squared: 0.0376 AIC: (df = 10) -10127.42 Fitted: Min 1Q Median 0.2326 0.2904 0.3044 Residuals: Min 1Q Median -0.27541 -0.02919 0.01474 0.05660 0.17896
> summary(m1gls6) Analysis of Variance Table Model: surf.gls(np = 6, covmod = expcov, x = m1df, d = 30) Sum Sq Df Mean Sq F value Regression 1.464693 27 0.054247883 Deviation 7.272117 1847 0.003937259 Total 8.736810 1874 Multiple R-Squared: 0.1676, Adjusted R-squared: 0.1555 AIC: (df = 28) -10354.59 Fitted: Min 1Q Median 0.1821 0.2925 0.3077 Residuals: Min 1Q Median -0.28931 -0.03357 0.00748
3.0487e-10
Pr(>F) 9.134883
3Q 0.3202 3Q
Pr(>F) 16.65575
3Q 0.3335 3Q 0.047494
Pr(>F) 13.77808
∆ (AIC)
10,78572
Max 0.3602 Max
< 2.22e-16
3Q 0.3282 3Q
Pr(>F) 14.92439
0.04470
1.2257e-13
Max 0.3858 Max
< 2.22e-16
Max 0.3828 Max 0.167853
< 2.22e-16
3Q 0.3369 3Q 0.15604
Max 0.3762 Max
Residual (ave)
Residual (max)
0,01654
0,18225
0,01474
0,17896
9,134883
19,55
16,65575
130,57
0,01131
0,17609
14,92439
46,44
0,008338
0,167853
13,77808
50,16
0,00748
0,15604
Tabla 1: Resumen de Criterios de aceptación de la muestra 1
Gráfico 1: Comparación grafica de Criterios de aceptación de la muestra 1
MUESTRA 2: > summary(m2gls2) Analysis of Variance Table Model: surf,gls(np = 2, covmod = expcov, x = m2df, d = 70) Sum Sq Df Mean Sq Regression 0,1925781 5 0,038515625 0,004513664 Deviation 5,6149975 1244 Total 5,8075756 1249 Multiple R-Squared: 0,03316, Adjusted R-squared: 0,02927 AIC: (df = 6) -6744,822 Fitted: Min 1Q Median 0,2426 0,2919 0,3078 Residuals: Min 1Q Median -0,27080 -0,03062 0,01329 0,05703 > summary(m2gls3) Analysis of Variance Table Model: surf,gls(np = 3, covmod = expcov, x = m2df, d = 60) Sum Sq Df Mean Sq F value Regression 0,3148355 9 0,034981721 Deviation 5,4927401 1240 0,004429629 Total 5,8075756 1249 Multiple R-Squared: 0,05421, Adjusted R-squared: 0,04735 AIC: (df = 10) -6764,34 Fitted: Min 1Q Median 0,2167 0,2929 0,3087 Residuals: Min 1Q Median -0,27028 -0,03164 0,01186 0,05529
F value 8,533118
3Q 0,3220 3Q
Pr(>F) 7,897212
Fvalue
2,0821e-11
3Q 0,3267 3Q
Max 0,3516 Max
0,18011
Pr(>F) 13,91718
3Q 0,3310 3Q 0,047115
F value
> summary(m2gls6) Analysis of Variance Table Model: surf,gls(np = 6, covmod = expcov, x = m2df, d = 30) Sum Sq Df Mean Sq F value Regression 1,149028 27 0,042556587 Deviation 0,003812232 4,658548 1222 Total 5,807576 1249 Multiple R-Squared: 0,1978, Adjusted R-squared: 0,1801 AIC: (df = 28) -6934,244 Fitted: Min 1Q Median 0,1910 0,2959 0,3087 Residuals: Min 1Q Median -0,255033 -0,032994 0,005225
Muestra 2 modelo ls2do ls3er ls4to ls5to ls6to
Max 0,3849 Max
0,18670
> summary(m2gls4) Analysis of Variance Table Model: surf,gls(np = 4, covmod = expcov, x = m2df, d = 50) Sum Sq Df Mean Sq F value Regression 0,7913825 14 0,056527322 Deviation 5,0161931 1235 0,004061695 Total 5,8075756 1249 Multiple R-Squared: 0,1363, Adjusted R-squared: 0,1265 AIC: (df = 15) -6867,784 Fitted: Min 1Q Median 0,2045 0,2934 0,3101 Residuals: Min 1Q Median -0,257842 -0,031078 0,009946 > summary(m2gls5) Analysis of Variance Table Model: surf,gls(np = 5, covmod = expcov, x = m2df, d = 40) Sum Sq Df Mean Sq Regression 0,9765626 20 0,048828128 0,003930849 Deviation 4,8310131 1229 Total 5,8075756 1249 Multiple R-Squared: 0,1682, Adjusted R-squared: 0,1546 AIC: (df = 21) -6902,803 Fitted: Min 1Q Median 0,1994 0,2925 0,3105 Residuals: Min 1Q Median -0,251341 -0,033757 0,007205
Pr(>F) 5,8886e-08
∆ (AIC)
8,533118
12,42178
3Q 0,3347 3Q 0,044059
Pr(>F) 11,16317
3Q 0,3365 3Q 0,043753
< 2,22e-16
Max 0,3896 Max 0,181248
Pr(>F) < 2,22e-16
Max 0,3828 Max 0,169854
< 2,22e-16
Max 0,3820 Max 0,150326
Residual (ave)
Residual (max)
0,01329
0,1867
7,897212
19,518
0,01186
0,18011
13,91718
103,444
0,009946
0,181248
12,42178
35,019
0,007205
0,169854
11,16317
31,441
0,005225
0,150326
Tabla 2: Resumen de Criterios de aceptación de la muestra 2
Gráfico 2: Comparación grafica de Criterios de aceptación de la muestra 2
MUESTRA 3 > summary(m3gls2) Analysis of Variance Table Model: surf,gls(np = 2, covmod = expcov, x = m3df, d = 70) Sum Sq Df Mean Sq F value Regression 0,2263984 5 0,045279682 Deviation 4,1141834 931 0,004419101 Total 4,3405818 936 Multiple R-Squared: 0,05216, Adjusted R-squared: 0,04707 AIC: (df = 6) -5074,264 Fitted: Min 1Q Median 0,2535 0,2974 0,3087 Residuals: Min 1Q Median -0,26462 -0,03380 0,01102 0,05134 > summary(m3gls3) Analysis of Variance Table Model: surf,gls(np = 3, covmod = expcov, x = m3df, d = 80) Sum Sq Df Mean Sq Regression 0,2047366 9 0,022748514 Deviation 4,1358452 927 0,004461537 Total 4,3405818 936 Multiple R-Squared: 0,04717, Adjusted R-squared: 0,03792 AIC: (df = 10) -5061,343 Fitted: Min 1Q Median 0,2538 0,2938 0,3079 Residuals: Min 1Q Median -0,26894 -0,03219 0,01434 0,05405 > summary(m3gls4) Analysis of Variance Table Model: surf,gls(np = 4, covmod = expcov, x = m3df, d = 30) Sum Sq Df Mean Sq Regression 0,5772212 14 0,041230084 Deviation 3,7633606 922 0,004081736 Total 4,3405818 936 Multiple R-Squared: 0,1330, Adjusted R-squared: 0,1198 AIC: (df = 15) -5139,777 Fitted: Min 1Q Median 0,2292 0,2998 0,3135 Residuals: Min 1Q Median -0,30381 -0,03519 0,00746 0,04531
10,24636
3Q 0,3235 3Q
Muestra 3 modelo ls2do ls3er ls4to ls5to ls6to
Fvalue
∆ (AIC)
10,24636
Max 0,3603 Max
0,15644
F value 5,098806
Pr(>F) 9,3938e-07
3Q 0,3216 3Q
Max 0,3580 Max
0,15785
F value 10,10111
Pr(>F) < 2,22e-16
3Q 0,3311 3Q
Max 0,3811 Max
0,18882
> summary(m3gls5) Analysis of Variance Table Model: surf,gls(np = 5, covmod = expcov, x = m3df, d = 30) Sum Sq Df Mean Sq Regression 0,6737396 20 0,033686978 Deviation 3,6668422 916 0,004003103 Total 4,3405818 936 Multiple R-Squared: 0,1552, Adjusted R-squared: 0,1368 AIC: (df = 21) -5152,121 Fitted: Min 1Q Median 0,2169 0,2986 0,3130 Residuals: Min 1Q Median -0,294072 -0,034585 0,006022 > summary(m3gls6) Analysis of Variance Table Model: surf,gls(np = 6, covmod = expcov, x = m3df, d = 20) Sum Sq Df Mean Sq Regression 0,8187491 27 0,030324041 Deviation 3,5218327 909 0,003874403 Total 4,3405818 936 Multiple R-Squared: 0,1886, Adjusted R-squared: 0,1645 AIC: (df = 28) -5175,929 Fitted: Min 1Q Median 0,1856 0,3000 0,3121 Residuals: Min 1Q Median -0,283142 -0,033845 0,005963
Pr(>F) 1,4176e-09
F value 8,415217
3Q 0,3322 3Q 0,045333
F value 7,826764
Pr(>F) < 2,22e-16
Max 0,3791 Max 0,171373
Pr(>F) < 2,22e-16
3Q 0,3345 3Q 0,044320
Max 0,3766 Max 0,151571
Residual (ave)
Residual (max)
0,01102
0,15644
0,01434
0,15785
5,098806
12,921
10,10111
78,434
0,00746
0,18882
8,415217
12,344
0,006022
0,171373
7,826764
23,808
0,005963
0,151571
Tabla 3: Resumen de Criterios de aceptación de la muestra 3
Gráfico 3: Comparación grafica de Criterios de aceptación de la muestra 3
IV.- RESULTADOS DE LA ESTIMACION CON MINIMOS CUADRADOS GENERALIZADOS En la figura siguiente, se muestra la imagen y la función paramétrica de tercer orden generada con cada una de las muestras.
Muestra 1 orden 3
Muestra 2 Orden 3
Muestra 3 Orden 2
Muestra 1 orden 3
Muestra 2 Orden 3
Muestra 3 Orden 2
Figura 9: Resultado de GLS de grado 3 para cada una de las muestras.
Como se aprecia en estos resultados el efecto de la las relaciones locales del ámbito espacial no es aun notada, pues aun cuando para cada caso se estableció la función teórica de ajuste a la varianza espacial, el método de por si, no considera las relaciones de vecindad en la definición de esta varianza espacial. A continuación se muestras los semi-variogramas para cada muestra y sus respectivas funciones de ajuste.
Muestra 1:Range= 60
Muestra 2: Range=60
Muestra 3: Range=80
Figura 10: Semivariogramas teóricos y empíricos, para la función de ajuste de 3er orden para cada muestra.
En el caso del ajuste a una función de 6to orden por mínimos cuadrado generalizados, los resultados fueron los siguientes:
Muestra 1 orden 3
Muestra 2 Orden 3
Muestra 3 Orden 2
Muestra 1 orden 3
Muestra 2 Orden 3
Muestra 3 Orden 2
Figura 11: Resultado de GLS de grado 6 para cada una de las muestras.
Los resultados para el ajuste funcional de orden seis parecen demostrar una mejor influencia de la variabilidad espacial que el caso del ajuste de orden 3. Al igual que aquel caso las funciones de varianza espacial que mejor se ajustaban al arreglo mostrado en el semi-variograma son de tipo exponencial.
Muestra 1:Range= 30
Muestra 2: Range=30
Muestra 3: Range=20
Figura 12: Semivariogramas teóricos y empíricos, para la función de ajuste de 6to orden para cada muestra.
V.- RESULTADOS DE LA PREDICCION CON KRIGING Kriging si considera como parte de sus fundamentos la dependencia espacial entre los residuales, y asume que esta dependencia es similar a la dependencia demostrada en la señal. Es por ello que los resultados de la predicción por Kriging son sustancialmente diferentes a los del ajuste por mínimos cuadrados generalizados. Como se notará en las figuras siguientes, una peculiar aglomeración de puntos describe para cada una de las muestras estudiadas un patrón interesantes en donde a simple vista se pues aprecias la forma que tiene el área de estudio (ver figura 1). Esto de por si es un buen indicio de lo que se quiere lograr pues en efecto, los procedimientos estadísticos están reconociendo el patrón de forma del área de estudio. En el estudio comparativo se analizará si esta similitud espacial es también atributiva, es decir, si los valores de NDVI reportados por la predicción Kriging para cada una de las muestras se parece al set de dato original.
890000
891000
892000
893000
894000
Las siguientes imágenes muestran los resultados de la predicción por Kriging tomando como función base el ajuste de mínimos cuadrados generalizados de tercer orden:
254000
255000
256000
257000
258000
25900
Figura 13: Predicción Kriging de con función de ajuste de tercer orden para la muestra 1
894000 893000 892000 891000 890000 254000
255000
256000
257000
258000
25900
890000
891000
892000
893000
894000
Figura 14: Predicción Kriging de con función de ajuste de tercer orden para la muestra 2
254000
255000
256000
257000
258000
25900
Figura 15: Predicción Kriging de con función de ajuste de tercer orden para la muestra 3
En el caso de la predicción Kriging basada en una función de orden 6, no se aprecian los efectos locales que se muestran en el caso de la base de orden 3
Figura 16: Predicción Kriging de con función de ajuste de sexto orden para todas las muestras
VI.- ANALISIS COMPARATIVO Dado que las limitaciones de tiempo para la finalización de este proyecto impidieron que se pudiese ahondar más en las posibilidades de R para exportar los resultados de las predicciones de Kriging a formatos digitalmente manejables en un procesador de imágenes avanzado, el Análisis comparativo se limitó a un análisis visual de primera instancia.
Figura 17: Análisis comparativo de los resultados de la muestra 1
Tal como se puede apreciar en la figura anterior, existe una gran similitud en cuanto a las formas entre los resultados de la predicción y el data set original. Por otro lado es interesante observar en el detalle que los patrones de intensificación de los colores (valores altos de NDVI) que se observa hacia el borde sur en la imagen original se repite casi de forma idéntica el la imagen de predicción.
Figura 18: Análisis comparativo de los resultados de la muestra 2
Aun cuando el patrón de forma se puede reconocer en los resultados desde la muestra 2, extrañamente se aprecia una baja diferenciación entre los valores de la predicción lo que hace que la imagen que produce sea difusa y hasta tenue; sin embargo los valores mas claramente diferenciados son aquellos que en la imagen original están relacionados con valores de mayor intensidad de NDVI aunque esto no puede ser del todo corroborado sin un análisis digital en profundidad.
En el análisis visual de la muestra 3, se define mejor el patrón de forma que en el caso de la muestra 2, pero peor que en la muestra 1. De hecho, aun cuando se observan patrones de dispersión que en la parte central coinciden con la el patrón de difusión de la imagen original, el modo de asociación es totalmente erróneo a primera vista (ver figura 24). Nuevamente seria necesario un estudio mas profundo para formar aseveraciones mucho mas firmes. Es importante señalar que para este análisis visual se tomaron en cuenta y se lograron homologar hasta donde se pudo aspectos importantes como:
• •
Resolución radiométrica: La imagen de predicción se produjo con 256 degradaciones de verde a marrón (terrain); equivalente a los 256 niveles digitales de la imagen original. Resolución espacial: La imagen de predicción se elaboró en base a una malla cuya unidad mínima es 30 x 30m, tal como la imagen original.
Figura 19: Análisis comparativo de los resultados de la muestra 3
CONCLUSIONES Aun cuando la intención fue en principio hacer un análisis comparativo mas formal, no se dispuso de los recursos suficientes como para exportar los resultados del Kriging en una imagen digitalmente manejable, de manera que pueda ser comparada fácilmente con la imagen original. Por otro lado se intentó traer el data set original al ambiente R, para hacer un análisis orientado a la comparación de los estadísticos de las predicciones Kriging con respecto a los estadísticos del data set original; sin embargo esto tampoco se pudo por la cantidad de datos del data seto original era inmanejable en R; todos estos inconvenientes hicieron que fuera factible estructurar una comparación mas solida que el simple análisis visual. Sin embargo existen suficientes indicios y argumentos para identificar las bondades de la metodología. En este sentido queda abierta la posibilidad de continuar profundizando la investigación, ensayando otros caso de estudio y mejorar la propuesta metodológica y el uso de esta herramienta para lograr el objetivo de extraer la imagen resultante como una imagen digitalmente manejable.
BIBLIOGRAFIA 1. ARMSTRONG, M., y Carignan, J.: Géostatistique Linéaire, Application au Domaine Minier.", École de Mines de Paris, Paris Francia 1997. 2. BRAVO, Lelys: Apuntes de Estadísticas Ambientales”. Universidad Simón Bolívar, Caracas Venezuela 2009 3. CORREA M, Juan Carlos y Nelfi González: “Introducción al R”. Postgrado en Estadística de la Universidad Nacional de Colombia, sede Medellín. Medellín 2002. 4. ESTEVES Cruz, Elmidio: “ Apuntes sobre estimación de recursos y reservas”. Departamento de Geología. Universidad del Pinar del Río. 5. GIRALDO H. Ramón: “Introducción a la geoestadistica” Universidad Nacional de Colombia, sede Bogotá 2002 6. GUEVARA D. José M.: “Métodos de estimación y ajustes de datos climáticos” Consejo de desarrollo Científico y Humanístico de la Universidad Central de Venezuela. Caracas, Venezuela, 2003 7. HOULDING, S. W.: 3D Geoscience Modelling. Springer-Verlag Berlin Heidelberg. Alemania 1994MSc. 8. MARTINEZ, Ciro.: ”Estadistica Basica Aplicada”. ECOE Ediciones. Bogotá Colombia 2006 9. REBOLLEDO W. Rafael: “Numerical Surface Models to improve the ground water retrieval. Some experiences in a case of study.” Fundación Instituto de Ingeniería. Caracas Venezuela, 2009 10. REDDY, Anji: “remote Sensing and Geographical information Systems”. BS Publications. Hyderabad, India 2001. 11. SMITH, Richard: ”Environmental statistics”. Universidad de Carolina del Norte. 2001
Departamento
de
estadística,