Abstract. Introducción

Uso de técnicas de visualización científica en SIG para el análisis visual de datos meteorológicos The use of scientific visualization techniques into

Author: Marta Naranjo Murillo

2 downloads 75 Views 107KB Size

Report

DOWNLOAD PDF

Recommend Stories

ABSTRACT

abstract:

ABSTRACT

Agron. Costarr. 9 (1): 103-113. 1985 Analisis y comentario EL PAPEL DE LA MUJER Y LA F AMIUA EN LA SOCIED AD COST ARRICENSE 1/ Alberto Pinto * Han

ABSTRACT

Agron.Costarr.9 (1): 13-20. 1985 UTILIZACION DE LA SEMOLINA DE ARROZ EN LA ALIMENTACION DE GALLINAS EN DESARROLLO Y POSTURAl/. Carlos Campabadal * M

costo. ABSTRACT

Huelva Abstract:

Agradecimientos. Abstract

Abstract. estructura

Comunicaciones ABSTRACT

05 ABSTRACT

Story Transcript

Uso de técnicas de visualización científica en SIG para el análisis visual de datos meteorológicos The use of scientific visualization techniques into GIS for meteorological data visual analysis Romel Vázquez Rodríguez1, Carlos Pérez Risquet1, Inti Y. González Herrera1, Juan Carlos Torres Cantero2 y Alexis Fajardo Moya3 1

Centro de Estudios de Informática, UCLV 2

Universidad de Granada, España

3

Facultad de Matemática, Física y Computación, UCLV {romel, cperez, inti}@uclv.edu.cu [email protected]

Resumen Durante muchos años se han desarrollado diversas técnicas de visualización que representan datos de simulaciones u obtenidos por instrumentos de medición, sobre todo aquellas orientadas a datos espaciales y temporales. La meteorología es una de las disciplinas que más se beneficia de este tipo de técnicas de visualización científica y de herramientas para el trabajo con datos espaciales, como son los SIG. En este trabajo se presentan las ideas esenciales de la integración de los Sistemas de Información Geográfica con la visualización científica, se mencionan las principales técnicas de visualización de datos multiparamétricos, así como las más adecuadas para el análisis visual de datos meteorológicos. Se muestra el uso de estas técnicas con datos meteorológicos de la provincia de Villa Clara, se analizan algunas variantes de implementación y se implementa una integración mezclada mediante la incorporación de un módulo de VC a un SIG. Palabras clave: Datos meteorológicos, SIG, visualización científica, visualización de datos multiparamétricos.

Abstract For several years some visualization techniques have been develop that represent simulation or observation data, especially those oriented to spatial and temporal data. Meteorology is a discipline that gets better benefits from that kind of scientific visualization techniques and spatial data tools as Geographic Information Systems. This paper shows the main ideas of the integration of Geographic Information Systems with Scientific Visualization; we mention the principal multiparametric visualization techniques and the more effective for meteorological visual analysis. We show the use of these techniques with meteorological data Villa Clara province, we analyze some implementation variants and we implements a merged integration through the adding of a scientific visualization module to a GIS. Keywords: GIS, meteorological data, mutiparametric Scientific Visualization, Scientific Visualization

Introducción El uso de Sistemas de Información Geográfica (SIG) ha llegado a ser esencial en todos los campos relacionados con la gestión del territorio, desde la geografía hasta el medio ambiente, pasando por las aplicaciones más clásicas de urbanismo y gestión de recursos. Actualmente se utilizan SIG para resolver problemas tan diversos como la planificación de la extinción de incendios, el análisis de riesgos ambientales o la propagación de contaminantes. Por otra parte, la visualización científica (VC) según [Morell and Pérez, 2006] significa encontrar una representación visual apropiada para un conjunto de datos, que permita mayor efectividad en el análisis y evaluación de los mismos. Simplifica el

1

análisis, comprensión y la comunicación de modelos, conceptos y datos en la ciencia y la ingeniería. La VC ofrece grandes ventajas sobre otros métodos de análisis de datos, permitiendo representar datos de varias dimensiones o variables, logrando visualizar cuatro o más variables al mismo tiempo. A este tipo de visualización se le conoce como visualización de datos multiparamétricos. Para el desarrollo de esta investigación se cuenta con datos meteorológicos de un reducido número de estaciones de la provincia de Villa Clara. Estos datos no pueden ser analizados suficientemente bien en forma numérica, por lo que surge la necesidad de visualizarlos, con el objetivo de realizar comparaciones, identificar patrones, encontrar correlaciones, detectar anomalías, variabilidad y las diferentes tendencias que se pueden presentar en las variables meteorológicas a lo largo del tiempo. La problemática consiste en que a pesar de contar con una serie temporal bastante completa de las variables meteorológicas, la información espacial es muy pobre debido a que se cuenta con sólo 4 estaciones, información que es insuficiente para la mayoría de los métodos de interpolación espacial. La integración de técnicas de VC con los SIG permitirá resolver este tipo de problemas, posibilitando mostrar e interactuar con datos de diversas variables asociadas a lugares puntuales en el espacio, es por eso que en este trabajo se presentan las ideas esenciales de la integración de los SIG con la VC, se mencionan las principales técnicas de visualización de datos multiparamétricos, así como las más adecuadas para el análisis visual de datos meteorológicos. Se muestra el uso de estas técnicas con datos meteorológicos de la provincia de Villa Clara, se analizan algunas variantes de implementación y se implementa una integración mezclada mediante la incorporación de un módulo de VC a un SIG.

Materiales y Métodos 1 SIG y VC La vinculación de las técnicas de VC con los SIG se presenta como una alternativa novedosa para la visualización de datos meteorológicos multiparamétricos puntuales (incluido el tiempo), procedente de pocas estaciones. Dotar a los SIG de este tipo de herramientas permitirá resolver los problemas de poca densidad espacial de los datos y constituye una buena alternativa para países con poca infraestructura meteorológica. La integración de la VC y los SIG según [Rhyne, 1994] se evidencia a partir de 4 métodos: Rudimentario: Mínima integración de datos entre los SIG y los sistemas de visualización. Operacional: Consistencia de datos geoespaciales. Funcional: Comunicación transparente entre los SIG y los sistemas de visualización. Mezclado: Conjuntos de herramientas que involucra ampliamente las 2 disciplinas.

El método rudimentario utiliza una mínima integración de datos e intercambio entre las dos tecnologías. El nivel operacional trata de proporcionar coherencia de los datos, mientras se eliminan las redundancias entre las dos tecnologías (véase [Cook et al., 1997]). El nivel funcional trata de proporcionar una comunicación transparente entre los respectivos entornos de software (véase [Mitas et al., 1997]). El enfoque mezclado se refiere al desarrollo de sistemas donde los conceptos de cartografía, SIG y VC se fundan en una única herramienta. 1.1 Integración de SIG y herramientas de VC A finales de los años 80 y principios de los 90 estas dos disciplinas se desarrollaron en paralelo de forma independiente. Raras veces los esfuerzos en el desarrollo de estándares de datos espaciales consideraban la manera en que estos se visualizaban. Las bibliotecas gráficas y los estándares han evolucionado independientemente de los modelos de datos [Rhyne and MacEachren,

2

2004]. Como resultado de esto, existen muchas ineficiencias asociadas con la visualización de datos geográficos. Entre ellas se incluyen, dificultades con el registro de los datos espaciales dentro de sistemas de visualización científica (SVC), producciones engorrosas de secuencias de animaciones en SIG, y quizás la más importante, la falta de conexión entre bases de datos y los ambientes de visualización que soportan visualización de datos espaciales [Hearnshaw and Unwin, 1994]. En la década del 2000 la visualización geográfica o geovisualización ha surgido como un sub campo único con sus propios retos. Desde la década del 90 y aún en la del 2000 los desarrolladores de herramientas de VC y SIG han realizado grandes esfuerzos para extender e integrar sus sistemas [Rhyne et al., 1994]. Los desarrolladores de SIG han estudiando la manera de incorporar las funcionalidades de visualización en tres dimensiones y de realizar animaciones de series de tiempo en sus sistemas. Por ejemplo, a finales de los 90, ESRI introdujo una herramienta de análisis 3D en ArcView para permitir visualizar datos de superficies y modelos tridimensionales. Hoy día esta herramienta de análisis ya está integrada en la suite de herramientas de ArcGIS. Por otra parte, los programadores de sistemas de VC y visualización de información (VI) han construido lectores de datos que soportan los formatos de datos espaciales como los modelos digitales de elevación (MDE) y los formatos de SIG comerciales. Por ejemplo, Advanced Visual Systems (AVS) desarrolló a finales de los 90 AVS-Arc, que es un lector de datos que permite la importación directa de datos de Arc-Info en formato de ESRI dentro del ambiente de visualización AVS. Actualmente la importación de formatos de SIG y la interacción con bases de datos están incorporados en la edición profesional de AVS/Express. Otro ejemplo de este tipo de interacción es la creación de un módulo del sistema Data Explorer de IBM para leer datos en formato de ESRI [Rhyne et al., 1994]. El nivel rudimentario de mover datos en formatos de SIG hacia las herramientas de VC se ha logrado, aunque en casos puntuales. Algunos ambientes de VC se han aproximado en el nivel operacional, permitiendo accesos directos a bases de datos de SIG. Sin embargo, esto suele ser en un solo sentido. Una vez que la herramienta de VC genera la imagen tridimensional o la animación, generalmente no es posible activar las funciones de consulta de los SIG desde la pantalla de visualización. Lograr la integración funcional de SIG y herramientas de VC requiere de estándares abiertos de datos de SIG, así como enlaces a programas que permitan que las herramientas de VC realicen análisis de datos espaciales y funciones de extracción de información (minería). También es factible el uso de sistemas expertos o una arquitectura basada en reglas con agentes inteligentes para facilitar la comunicación transparente entre SIG y herramientas de VC. [Rogowitz and Treinish, 1993]. Los sistemas mezclados requieren repensar el proceso de desarrollo de herramientas SIG-VC. En este sentido, la cartografía está bien posicionada para servir como puente entre los SIG y la VC. Ya existen algunas herramientas que implementan este enfoque de integración avanzado. En la siguiente sección se presentan estas herramientas con un mayor nivel de detalle. 1.2 Herramientas que implementan el enfoque mezclado de integración SIG-VC Algunos de los primeros intentos del esquema mezclado de integración entre los SIG y la VC se han materializado a través de herramientas como GeoVista Studio y Snap-Together Visualization. Ambas herramientas están basadas en redes de componentes, que permiten la construcción de complejos flujos de trabajos que vinculan componentes para el manejo de formatos de datos geográficos y de diferentes técnicas de VC. GeoVista Studio GeoVista Studio es una herramienta de código abierto que implementa un ambiente de desarrollo basado en componentes. Suministra una interfaz de programación visual como muchos sistemas de VC, a través de la cual los usuarios pueden construir aplicaciones de forma rápida utilizando JavaBeans (que son distribuidos por Studio o adquiridos de otras fuentes). El ambiente de programación visual permite a los analistas empaquetar funcionalidades dentro de un programa de trabajo (en forma de

3

JavaBeans, applets o aplicaciones. GeoVista soporta el desarrollo de aplicaciones geográficas y no geográficas (por ejemplo, a través de herramientas de VI). El principal objetivo de GeoVista es soportar la fusión de diversas capacidades visuales y analíticas en una herramienta de análisis que posibilite la multi-perspectiva. GeoVista incluye además un conjunto de técnicas de visualización clásicas, como diagramas de dispersión, coordenadas paralelas, Self Organizing Map (SOM). Para profundizar en temas relacionados con GeoVista puede consultarse [Amant and Cohen, 1998; Gahegan et al., 2002; Takatsuka and Gahegan, 2002; MacEachren et al., 2003]. 2 Visualización de datos climáticos El diseño de representaciones visuales intuitivas y significativas en el contexto del clima se enfrenta a una variedad de desafíos. En primer lugar, la heterogeneidad de los datos relacionados con el clima (espaciales, temporales, multivariados; basados en regiones, basados en estaciones) requiere una variedad de técnicas de visualización (por ejemplo, los mapas 2D, esferas 3D, gráficos de tiempo, diagramas de dispersión, entre otros). Se necesitan además técnicas de visualización para analizar datos dependientes del tiempo en 3 dimensiones o grandes series de tiempo de datos multivariados de forma interactiva. En segundo lugar, la visualización de datos climáticos la utilizan grupos de usuarios heterogéneos, incluidos usuarios con diferentes habilidades, grado de calificación, intereses y que trabajan en diferentes disciplinas, que se enfrentan a numerosas tareas. En tercer lugar, la visualización de datos científicos no es sencilla. Esto se debe a que existe una gran variedad de herramientas, técnicas y parámetros que hay que tener en cuenta. Para datos climáticos y meteorológicos en particular se han desarrollado una variedad de técnicas (véase [Schröder, 1997; Treinish, 1999]) y se han adaptado a dominios específicos (véase, por ejemplo, [American-Meteorological-Society, 1993]). Varias técnicas para la visualización de datos meteorológicos y climáticos por ejemplo han sido desarrolladas para datos dispersos escalares [Treinish, 1994], como métodos basados en mallas de triángulos [Treinish, 1994], iconos univariados o multivariados: [Scanlon, 1994)], [Nocke et al., 2007], [Stier, 2005], diagramas de iconos de tiempo [Saito et al., 2005]. Para datos escalares en mallas regulares 2D [Stier, 2005], se tienen los siguientes ejemplos: color estándar e imágenes de Isolíneas [Kottek and Rubel, 2003], representación de la altura [Treinish, 1999], representación de globo [Chen, 1993]. En el caso de datos escalares en mallas regulares 3D [Riley et al., 2003]: Isosuperficies [Treinish, 1994], [Baker and Bushell, 1995], métodos de descomposición [Treinish, 1999], renderizado directo de volúmenes [Riley et al., 2003], [Ribarsky et al., 2002], renderizado realista [Baker and Bushell, 1995], [Marchesin et al., 2004]. Con datos vectoriales 2D en mallas regulares [Griebel et al., 2004] se pueden ejemplificar: flechas iconos de viento [Treinish, 1999], [Kottek and Rubel, 2003], métodos basados en topologías [Wong et al., 2000], [Doleisch et al., 2004] y para datos vectoriales en 3D: iconos [Chen, 1993], líneas de campo [Chen, 1993], [Treinish, 1994], [Griebel et al., 2004], métodos de descomposición [Doleisch et al., 2004], métodos basados en texturas y renderizado directo de volúmenes (Griebel et al., 2004). Algunos métodos para visualizar datos en su contexto temporal se pueden consultar en [Saito et al., 2005]. Otros métodos han sido elaborados para visualizar datos multivariados [Macêdo et al., 2000; Doleisch et al., 2004; Stier, 2005). Sin embargo, la aplicación de técnicas sofisticadas de interacción en meteorología y el estudio del clima se limita a unos pocos ejemplos [Treinish, 1999; Macêdo et al., 2000; Doleisch et al., 2004]. En esta sección se mostraron algunas de las técnicas de visualización científica aplicables a datos meteorológicos. Por los tipos de datos que comúnmente están disponibles en esta área, se emplean mayoritariamente técnicas de visualización de datos multiparamétricos para su representación y análisis visual. En las siguientes secciones se detallan algunas de estas técnicas y se muestra su uso con datos meteorológicos de la provincia de Villa Clara, demostrando las ventajas de su uso en esta área

4

específica. Se presentan además variantes de implementación en una aplicación práctica y se implementa un módulo de VC a un SIG mediante una integración mezclada. 3 Técnicas de Visualización para datos multiparamétricos Existe una multitud de problemas en que cada punto de dato contiene más de un atributo. Estos atributos pueden ser fechas, lugares, precios o valores descriptivos, y pueden tener o no una referencia espacial. A este tipo de datos se les llama multiparamétricos y se encuentran generalmente en aplicaciones de minería de datos, estadística e inteligencia artificial [Keim, 2002]. Una definición más precisa de datos multiparamétricos se puede encontrar en [Bergeron and Grinstein, 1989; Brodlie, 1992; Schumann and Müller, 2000]. El objetivo fundamental de los métodos de visualización para datos multiparamétricos es lograr que las representaciones revelen correlaciones o patrones entre los atributos [Eick, 2000; Theisel, 2000; Keim, 2002]. Con este fin existe actualmente una amplia gama de técnicas de visualización, para las cuales se han creado además diversas mejoras. Las técnicas pueden ser clasificadas en geométricas, basadas en iconos, basadas en píxel y proyecciones [Theisel, 2000; Keim, 2002; Salgado Milán, 2003]. 3.1 Técnicas geométricas Las técnicas geométricas son aquellas que utilizan elementos como líneas, puntos o curvas como propiedades visuales para representar los datos. Existe gran número de ellas, como Prosection Views [Bergeron and Grinstein, 1989; Brodlie, 1992; Schumann and Müller, 2000], hyper slices [Wijk and Liere, 1993], parahistogramas [Ong and Lee, 1996] y coordenadas en forma de estrellas, pero hay tres que sobresalen por su generalidad y amplio uso. Estas son los diagramas de dispersión [Cleveland, 1993], coordenadas paralelas [Inselberg and Dimsdale, 1990] y los gráficos de Andrews [Andrews, 1972; Matlab, 2010].

Diagramas de dispersión (en inglés ScatterPlot) El diagrama de dispersión es una técnica simple muy utilizada. Su forma más sencilla se manifiesta cuando los datos tienen solo dos dimensiones. Con dos dimensiones la técnica consiste en trazar un eje de coordenadas y utilizar los valores de las dimensiones como 2 puntos (x,y) de R, resultando un gráfico donde se observan dispersos los puntos de datos. Para datos multiparamétricos es muy frecuente utilizar matrices de diagramas de dispersión. Las matrices resultantes son cuadradas y el elemento (i,j) de la matriz es un diagrama de dispersión de la dimensión i y la j. El diseño evita la pérdida de información pero en cambio son engorrosos los análisis complejos. Una deficiencia adicional es que la diagonal principal de la matriz es subutilizada. Algunos trabajos actuales están encaminados a aprovechar mejor esta región de la representación [Cui et al., 2005]. Coordenadas Paralelas La técnica de las coordenadas paralelas [Inselberg and Dimsdale, 1990] es un esquema simple de gran generalidad que permite visualizar conjuntos de datos multidimensionales. Esta técnica geométrica es una de las más utilizadas debido a su fácil implementación y los buenos resultados que se obtienen al aplicarla [Keim, 2002]. Obsérvese la Figura 1b). Esta técnica usa un sistema de coordenadas como base y consiste en crear un eje de coordenadas para cada atributo colocándolos paralelamente. El valor de cada dimensión en un determinado punto de datos es marcado en el eje correspondiente. La representación final para un objeto es una línea que recorre las posiciones marcadas en cada dimensión [Theisel, 2000; Keim, 2002].

5

El color de las líneas que representan los objetos puede ser elegido por varios criterios. El más simple es utilizar un color constante para todos los objetos. Un criterio que maximiza la calidad de la imagen es seleccionar una dimensión para que sea el color del objeto, de tal forma que puntos con diferentes valores en el atributo de color serán mostrados con diferentes tonos y los similares serán mostrados con tonos equivalentes [Theisel, 2000; Keim, 2002]. Gráfico de Andrews Una idea similar para representar datos multiparamétricos es el gráfico de Andrews. En esta técnica cada observación es representada por una función f(t) que se evalúa en el intervalo [0,1]. Cada función es una serie de Fourier, cuyos coeficientes se igualan a los valores de las dimensiones para cada observación [Andrews, 1972; Matlab, 2010]. Esta técnica permite identificar con facilidad diferencias entre grupos de observación, ya que por lo general observaciones pertenecientes a un mismo grupo presentan una forma de la función similar. Los análisis sobre variables individuales resultan en cambio mucho más engorrosos [Matlab, 2010]. La virtud fundamental de la técnica es que puede representar conjuntos de datos de un tamaño relativamente grande y además con un número de dimensiones elevado. 3.2 Técnicas basadas en iconos Las técnicas basadas en iconos tienen dos parámetros que la caracterizan: el primero es el tipo de figura que representará cada observación, o sea, la forma del icono; el segundo parámetro es la forma en que se definirá la posición de cada icono en la imagen [Theisel, 2000; Ward, 2002]. Estas técnicas no sufren de pérdida de información. Se logra evitar la pérdida de información al realizar una proyección de las dimensiones a diferentes atributos de un icono [Theisel, 2000; Salgado Milán, 2003]. Entre los métodos para crear iconos están los rostros de Chernoff (Chernoff Face) y los campos de estrellas (StarField). Además, suelen crearse editores de iconos para aplicaciones específicas [Theisel, 2000; Salgado Milán, 2003; Andrews, 2005]. Por otro lado, la solución más popular para la colocación de los iconos en la imagen está basada en el uso de proyecciones [Ward, 2002]. Campo de estrellas El campo de estrellas utiliza un algoritmo para componer los iconos, lo que le confiere cierta generalidad. En la forma básica el método utiliza dos dimensiones como coordenadas de posición en un eje imaginario [Theisel, 2000; Andrews, 2005]. El resto de las dimensiones son normalizadas al intervalo [0,1]. Estas coordenadas son el punto de inicio en el dibujado del icono. Las dimensiones restantes se expresan a partir de líneas que parten del punto inicial y cuya longitud está determinada por el valor del atributo. Estas líneas o rayos que representan las diferentes dimensiones están dispuestos entre sí con igual distancia angular, lo que genera una figura de estrella. Frecuentemente los extremos de las líneas son conectados entre sí. Esta variación elimina la silueta de estrella y crea una figura cerrada que suele presentar más claramente las características del objeto [Eick, 2000]. En la Figura 1c) puede observarse un ejemplo. Todos los puntos del conjunto de datos pueden mostrarse con el mismo color, pero resulta muy conveniente utilizar esta característica para codificar algún atributo de interés. Igualmente pueden usarse otros rasgos de la figura para codificar otras informaciones, como por ejemplo, la calidad de los datos [Xie et al., 2006]. Una cuestión de particular importancia en la técnica es la estrategia de posicionamiento del icono. En el proceso de posicionamiento de los iconos pueden usarse los datos de ciertas dimensiones, que en el caso más simple utiliza dos dimensiones y en caso de un número mayor de dimensiones requiere el uso de proyecciones [Ward, 2002].

6

3.3 Técnicas orientadas a píxel Se ha mencionado que la visualización de un conjunto de datos de gran tamaño resulta un reto para técnicas geométricas y basadas en iconos. Al graficarlos suele surgir cierto desorden, que está originado por el tamaño de la figura que representa una observación simple. A partir de esta idea resulta lógico concluir, que minimizando el espacio que ocupa un solo punto de datos en la imagen se mejoraría la percepción visual [Yang et al., 2003; Andrews, 2005; Hansen and Johnson, 2005]. Las técnicas basadas en píxel son las más eficientes cuando el número de dimensiones es grande y cuando crece el número de registros. Esto se debe a que utilizan un píxel para representar cada atributo de una observación. Los retos fundamentales en estos métodos son la elección del color para cada elemento y el modo de posicionamiento de los píxeles [Keim, 2000; Keim, 2002]. En este esquema el asunto principal es como colocar los píxeles en la imagen. Este tipo de técnicas utilizan diferentes modos de posicionamiento para lograr diferentes objetivos. Colocar los píxeles en la forma apropiada ofrece la posibilidad de observar información sobre correlaciones, dependencias y regiones trascendentales. Dos de los modos de posicionamiento de los píxeles son: los Patrones Recursivos y los Segmentos Circulares [Hansen and Johnson, 2005]. La técnica de los patrones recursivos se basa en un posicionamiento recursivo general de atrás hacia delante de los píxeles. Está particularmente dirigida a representar conjunto de datos con un orden natural de acuerdo a un atributo, propiedad que la convierte en una opción para problemas de series de tiempo [Keim, 2000; Theisel, 2000; Keim, 2002]. Los segmentos de círculo utilizan como imagen base un círculo que es dividido en segmentos iguales a partir del origen. Cada segmento corresponde a un atributo del conjunto de datos. Dentro de cada segmento el valor del atributo para cada registro de datos se representa con un píxel simple. La colocación de los píxeles comienza en el centro de la circunferencia y continúa hacia fuera dibujando sobre una línea ortogonal al segmento [Ankerst et al., 1996; Hansen and Johnson, 2005]. Debe observarse que los únicos atributos visuales de estas técnicas son la localización de los píxeles y la intensidad del color. De ello resulta que la elección del color sea un proceso de vital importancia, que requiere escalas de colores elegidas cuidadosamente para cada uno de los atributos [Ankerst et al., 1996; Keim, 2000; Keim, 2002]. Resultados y Discusión 4 Datos meteorológicos de la provincia Villa Clara Los datos meteorológicos tienen de manera general 3 componentes: el espacio, el tiempo y la información asociada a estos dos aspectos. Es decir, las variables meteorológicas que se tienen en cuenta en el análisis espacio temporal que se quiera realizar. Los sucesos meteorológicos se pueden analizar espacialmente para detectar lo que ocurre en las diferentes regiones del planeta. El componente temporal por su parte permite analizar estos sucesos en el tiempo, comprender los cambios de las variables meteorológicas en los diferentes momentos, estaciones del año, etc. Las variables meteorológicas generalmente son medidas por radares, satélites, o simplemente estaciones meteorológicas de medición. Los datos meteorológicos recopilados por el Instituto de Meteorología de Villa Clara representan una serie temporal de cada una de las variables recogida desde 1977 hasta la actualidad. Las variables meteorológicas recopiladas son: temperatura media, mínima y máxima promedio en la decena, humedad relativa media, mínima, y máxima promedio en la decena, nubosidad (promedio en octavos en la decena), velocidad media del viento (promedio en la decena), lluvia total en la decena, insolación (promedio de horas luz en la decena), tensión de vapor de agua (promedio en la decena) y presión atmosférica (promedio en la decena). De cada una de las 4 estaciones meteorológicas de la provincia se cuenta con una serie temporal de las 13 variables mencionadas.

7

Tabla 1. Tabla que almacena los datos meteorológicos. Año

Mes

Año - Decena

Temp

Hum Rel

…

1977

1

197701

20

73

…

1977

1

197702

18

77

…

1977

2

197705

23

83

…

1978

…

…

…

…

…

Para el almacenamiento de los datos meteorológicos se han utilizado varios formatos de datos (bases de datos, archivos texto, etc.). La Tabla 1 muestra un fragmento de la forma que se almacenan estos datos. En esta tabla se almacenan los registros promedio en diez días para cada una de las variables meteorológicas. Estos registros se tienen para cada una de las estaciones. Los datos originales fueron procesados mediante métodos estadísticos y de limpieza de datos para corregirlos y eliminarles ruido, pues contenían valores ausentes y otros fuera de rango.

5 Visualización de los datos meteorológicos de Villa Clara Existen varias formas de visualizar datos meteorológicos con técnicas de VC. Algunas de estas permiten la visualización sobre mapas, para que se tenga una percepción de la zona geográfica a la que se asocian los datos. En particular, las técnicas de VC para datos multiparamétricos no necesariamente tienen que estar asociadas a un mapa, como las que se muestran en la figura 1. No obstante, esas mismas técnicas se pueden aplicar a todas las variables de cada una de las estaciones y extraer de allí correlaciones entre determinada variable de varias estaciones. Es posible utilizar, por ejemplo, coordenadas paralelas para mostrar las 13x4 (52) variables correspondientes a las 4 estaciones.

a)

b)

Fig. 1. a) Segmentos de círculo y b) Coordenadas Paralelas con las 13 variables meteorológicas de las 4 estaciones.

Otra variante de implementación consiste en visualizar los datos de cada estación por separado y mostrar un mapa, garantizando que se tenga una percepción sobre qué visualización corresponde a cada región. Esto puede lograrse mediante una flecha o línea de la región al panel donde se muestra la visualización de cada estación (véase la Figura 1b). No obstante, algunas de las técnicas de VC de datos multiparamétricos se pueden mostrar sobre la región, como es el caso de segmentos de círculo (véase la Figura 1a), patrón recursivo, y las técnicas basadas en iconos, mostrando sobre cada estación un icono que representa el conjunto de variables para una observación a la vez. En este caso se puede emplear una barra desplazable para variar el icono sobre el mapa de acuerdo a otras variables, como el tiempo.

Implementación de técnicas de VC en un SIG

8

Como parte de esta investigación se implementó un módulo de visualización de datos multiparamétricos con un conjunto de técnicas incorporadas. La variante utilizada para integrar este módulo con un SIG fue la integración mezclada entre VC y SIG. El módulo de VC desarrollado se incorporó a gvSIG, que es un SIG completamente libre, modular y fácil de extender. Los datos de las cuatro estaciones están en varios formatos. De ellos, el que se utiliza para realizar la visualización es el formato .arff. Entre las modificaciones realizadas a gvSIG están la incorporación del paquete de VC con las clases de lectura de archivos en formato .arff, y las clases correspondientes al procesamiento de los datos y técnicas de visualización de datos multiparamétricos. Además se le incorporó un menú que le permite al usuario seleccionar el archivo correspondiente a los datos de una estación y seleccionar las técnicas que desea emplear en la visualización de los datos. La visualización de los datos se realiza en paneles independientes, como se muestra en la Figura 2.

Fig. 2. Visualización de los datos meteorológicos de una estación. Coordenadas paralelas (superior izquierda), campo de estrellas (superior derecha), segmento de círculos (inferior derecha), gráfico de Andrews (inferior izquierda).

El módulo de VC le permite al usuario obtener información visual acerca de los datos meteorológicos de las 4 estaciones de la provincia Villa Clara, elegir las variables a visualizar, el por ciento del conjunto de datos a analizar, y el intervalo de tiempo que se desea visualizar. La principal ventaja de utilizar técnicas de VC con datos meteorológicos es la posibilidad de realizar comparaciones, identificar patrones, encontrar correlaciones, detectar anomalías, variabilidad, y poder extraer las diferentes tendencias que se pueden presentar en las variables meteorológicas, tratando siempre de poder representarlas de forma tal que se pueda extraer información sobre el espacio y el tiempo. Otra de las ventajas que proporciona el uso de este tipo de técnicas para datos meteorológicos es la posibilidad que brindan estas técnicas para interactuar con los datos. Por ejemplo, en la técnica de coordenadas paralelas se puede cambiar el orden de los ejes y de esta forma observar mejor las relaciones entre determinas variables meteorológicas, incluir o quitar algunas variables, según interese en el análisis. Esta última forma de interacción está presente en todas las técnicas descritas en este trabajo. En el caso de segmentos de círculo, un tipo de interacción es la reorganización de los datos con respecto a una variable específica, y esto se logra haciendo clic en el área correspondiente a la variable.

Conclusiones

9

En este trabajo se presentaron las ideas esenciales acerca de la integración de técnicas de VC con SIG, y se relacionan varias técnicas de VC aplicables en el área de la climatología, haciendo énfasis en las técnicas de visualización de datos multiparamétricos. Se presentó un caso de uso real con datos meteorológicos de la provincia Villa Clara, para el que se implementaron varias técnicas de visualización de las relacionadas en el trabajo, y se discutieron variantes para su implementación. Se desarrolló un módulo de VC, que fue incorporado a un SIG (gvSIG) mediante la implementación del enfoque mezclado de integración entre estas disciplinas. El módulo desarrollado incluye varias técnicas de visualización y brinda un conjunto amplio de posibilidades de interacción con los datos. Conviene señalar que, aunque este trabajo fue realizado para resolver un problema real de análisis visual de datos meteorológicos de la provincia Villa Clara, las herramientas desarrolladas son generales y permiten la lectura, visualización y análisis de cualquier tipo de datos tabulares en formato arff. Como trabajo futuro se propone extender el módulo desarrollado para permitir la lectura de datos en otros formatos, y permitir la visualización sobre mapas de algunas de las técnicas desarrolladas, asociando la técnica a la ubicación en el mapa de la estación cuyo conjunto de datos está siendo visualizado (ver Figura 1), así como la incorporación de nuevas técnicas de visualización de datos multiparamétricos.

Referencias Bibliográficas Amant, R. S. and P. R. Cohen. Intelligent Support for Exploratory Data Analysis, Computational and Graphical Statistics, 1998, 7(4): 545-558. American-Meteorological-Society. Guidelines for Using Color to Depict Meteorological Information: IIPS Subcomitte for Color Guidelines, 1993. Andrews, D. F. Plots of high dimensional data, Biometric, 1972, 28(1): 125-137. Andrews, K. Information Visualisation, 2005. [Disponible en: http://courses.iicm.edu/ivis/] Ankerst, M., a. H. D.A. Keim, et al. 'Circle Segments': A Technique for Visually Exploring Large Multidimensional DataSet, San Francisco, 1996. Baker, M. P. and C. Bushell. After the Storm: Considerations for Information Visualization, IEEE Comput. Graph. Appl., 1995, 15(3): 12-15. Bergeron, R. D. and G. Grinstein. A Reference Model for the Visualization of Multidimensional Data, Hamburg, 1989. Brodlie, K. W. Scientific Visualization: Techniques and Applications. Springer-Verlag, 1992. 284. Chen, P. C. A Climate Simulation Study, USA, 1993. Cleveland, W. S. Visualizing Data, Summit New Jersey, 1993. Cook, D., J. Symanzik, et al. Dynamic graphics in a GIS: More Examples Using Linked Software, Computers & Geosciences, 1997, 23: 371-385. Cui, Q., M. O. Ward, et al. Enhancing Scatterplot Matrices for Data with Ordering or Spatial Attributes, 2005. [Disponible en: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.107.3157&rep=rep1&type=pdf] Doleisch, H., P. Muigg, et al. Interactive Visual Analysis of Hurricane Isabel with SimVis, IEEE Visualization, 2004. Eick, S. G. Visualizing Multi-Dimensional Data, ACM SIGGRAPH, 2000, 34, No.1.

10

Gahegan, M., M. Takatsuka, et al. Introducing GeoVista Studio: an Integrated Suite of Visualization and Computational Methods for Exploration and Knowledge Construction in Geography, Computers, Environment and Urban Systems, 2002, 26(4) (267-292). Griebel, M., T. Preusser, et al. Flow Field Clustering via Algebraic Multigrid, IEEE Visualization, 2004. Hansen, C. D. and C. R. Johnson. The Visualization Handbook. Elsevier, 2005. Hearnshaw, H. M. and D. J. Unwin. Visualization in Geographical Information Systems. Chichester, 1994. Inselberg, A. and B. Dimsdale. Parallel Coordinates: A tool for Visualizing Multi-Dimensional Geometry, San Francisco, 1990. Keim, D. A. Designing Pixel-Oriented Visualization Techniques: Theory And Applications, IEEE Transactions ON Visualization and Computer Graphics, 2000, 6. Keim, D. A. Information Visualization and Visual Data Mining, IEEE Transactions on Visualization and Computer Graphics, 2002, 7, No. 1. Kottek, M. and F. Rubel. Globale Klimadaten in Standardisierter Darstellung, Wiener Meteorologische Schriften Heft 1 2003. MacEachren, A., X. Dai, et al. Exploring High-D Spaces with Multiform Matricies and Small Multiples, Seattle, WA, 2003. Macêdo, M., D. Cook, et al. Visual Data Mining in Atmospheric Science Data, Springer, 2000. Marchesin, S., S. Dischler, et al. 3D ROAM for Scalable Volume Visualization, 2004. Matlab. Ayuda del Matlab, 2010. [Disponible en: http://www.mathworks.com/access/helpdesk/help/toolbox/stats/andrewsplot.html] Mitas, L., W. M. Brown, et al. Role of Dynamic Cartography in Simulations of LandScape Processes based on Multi-Variate fields, Computers & Geosciences, 1997, 23: 437- 446 Morell, A. and C. Pérez. Biblioteca de módulos de visualización de fluidos para OpenDX, Ciego de Ávila, 2006. Nocke, T., M. Flechsig, et al. Visual Exploration and Evaluation of Climate-Related Simulation Data, 2007. Ong, H. L. and H. Y. Lee. Software Report WInViz -a Visual Data Analysis Tool, Computation & Graphics, 1996, 20(1): 83-84. Rhyne, T. M. Going Virtual with Geographic Information and Scientific Visualization 1994. [Disponible en: http://www1.elsevier.com/homepage/sad/cageo/cgvis/rhyne/rhyne.htm] Rhyne, T. M., W. Ivey, et al. Visualization and Geographic Information System Integration: What are the Needs and Requirements, if any?, IEEE Visualization, 1994. Rhyne, T. M. and A. MacEachren. Visualizing Geospatial Data, 2004. Ribarsky, W., N. Faust, et al. Visual Query of Time-Dependent 3D Weather In a Global Geospatial Environment Mining Spatio-Temporal Information Systems, 2002. Riley, K., D. Ebert, et al. Visually Accurate Multi-Field Weather Visualization, IEEE Visualization, 2003. Rogowitz, B. E. and L. A. Treinish. An Architecture for Perceptual Rule-Based Visualization, 1993. Saito, T., H. N. Miyamura, et al. Two-Tone Pseudo Coloring: Compact Visualization for one-Dimensional Data, Minneapolis, MN, USA, 2005. Salgado Milán, E. Visualization Techniques, 2003: 9. Scanlon, C. H. Cockpit Graphical Weather Information Shown to Enhance Efficiency, Safety, and Situational Awareness, 1994. Schröder, F. Visualisierung Meteorologischer Daten, Springer, 1997. Schumann, H. and W. Müller. Visualisierung Grundlagen und Allgemeine Konzepte. Springer Verlag, Heidelberg, 2000. Stier, P. The aerosol-Climate Model Echam5-Ham, Atmosheric Chemistry and Physics, 2005.

11

Takatsuka, M. and M. Gahegan. GeoVista Studio: a Codeless Visual Programming Environment for Geoscientific Data Analysis and Visualization, Computers & Geosciences, 2002, 28(10): 1131-1144. Theisel, H. Scientific Visualization, 2000. [Disponible en: http://www.aimatshape.net/s05_sciviz.zip] Treinish, L. A. Case Study: Severe Rainfall Events in Northwestern Peru (Visualization of Scattered Meteorological Data), IEEE, 1994. Treinish, L. A. Task-Specific Visualization Design, IEEE, 1999. Ward, M. O. A Taxonomy of Glyp Placement Strategies for Multidimensional Data Visualization. Computer Science Department. 2002. Wijk, J. J. v. and R. D. v. Liere. Hyperslice, Los Alamitos, 1993. Wong, P. C., H. Foote, et al. Vector Fields Simplification - A Case Study of Visualizing Climate Modeling and Simulation Data Sets, 2000. Xie, Z., S. Huang, et al. Exploratory Visualization of Multivariate Data with Variable Quality, IEEE, 2006. Yang, J., A. Patro, et al. Value and Relation Display for Interactive Exploration of High Dimensional Datasets, 2003.

12

Recommend Stories

Story Transcript

Get in touch

Social