INTEGRACIÓN DE METADATOS EN UN SISTEMA DE INFORMACIÓN CORPORATIVO: LA IDE DE NAVARRA

INTEGRACIÓN DE METADATOS EN UN SISTEMA DE INFORMACIÓN CORPORATIVO: LA IDE DE NAVARRA Clerigué Arrieta, R. 1; Echamendi Lorente, P. 2; Fontano Ruiz, S.

13 downloads 71 Views 380KB Size

Recommend Stories


Un nodo local de la IDE de España: ideac
Un nodo local de la IDE de España: ideAC Pedro A. González (1), Miguel Lorenzo (2), Miguel R. Luaces (3), José R. Paramá (3) (1) Servicio de Asistenci

LA ETICA EN EL SISTEMA FINANCIERO: UN SISTEMA DE CUMPLIMIENTO
LA ETICA EN EL SISTEMA FINANCIERO: UN SISTEMA DE CUMPLIMIENTO Resumen: Una parte significativa de la doctrina ha señalado la reciente crisis financie

IDE y Análisis de datos
IDE y Análisis de datos Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff IDE y Análisis de datos • • • • Presentación Objetivos Meto

TXISTOR, UN PRODUCTO TRADICIONAL DE NAVARRA
Universidad Publica de Navarra Nafarroako Unibertsitate Publikoa ESCUELA TECNI CA SUPERI OR DE I NGENI EROS AGRONOM OS NEKAZARI TZAKO I NGENI ARI E

Story Transcript

INTEGRACIÓN DE METADATOS EN UN SISTEMA DE INFORMACIÓN CORPORATIVO: LA IDE DE NAVARRA Clerigué Arrieta, R. 1; Echamendi Lorente, P. 2; Fontano Ruiz, S. 3; Sabando Grasa, C. 4

Trabajos Catastrales, S.A. Departamento de Ingeniería Ctra. del Sadar s/n - Edificio El Sario 31006 Pamplona (España) Tfno: (+34) 948 240550 Fax: (+34) 948 249209 Palabras clave: Metadatos, Sistemas de información corporativo, Infraestructuras de Datos Espaciales, Navarra., SITNA (Sistema de Información Territorial de Navarra), IDENA (Infraestructura de Datos Espaciales de Navarra). Resumen: Navarra ha hecho un gran esfuerzo en los últimos años por disponer de un verdadero Sistema de Información Territorial, (más conocido por su acrónimo SITNA) y que se ha configurado como el componente dentro del Sistema de información corporativo de Navarra que pone a disposición de todos los ciudadanos datos de muy diversa índole referidos espacialmente al territorio de dicha comunidad. Los trabajos de puesta en marcha del Sistema provocaron la creación de un importante almacén de información geográfica, debidamente estructurada, sobre el territorio de Navarra. Al mismo tiempo, fue preciso establecer toda una serie de procedimientos que gestionaran de modo eficiente todo este tráfico de datos y se desarrollaron herramientas para que los usuarios pudieran hacer uso de la información (por ejemplo, http://sitna.cfnavarra.es). A pesar del éxito indudable de la implantación de todas estas iniciativas, el paso del tiempo hizo patente que existía una importante laguna en la medida que la carga de datos se había realizado sin tener en cuenta la cuestión de los metadatos. En aquellos momentos, la falta de estándares, experiencias y coordinación entre instituciones dibujaban, en definitiva, un horizonte poco claro sobre esta materia y desaconsejaban el diseño de un sistema de metadatos de incierto futuro. La evolución de esta cuestión en los dos últimos años en Europa ha sufrido un cambio radical a partir de la publicación de la propuesta de Directiva Europea INSPIRE [1] (Infrastructure for Spatial InfoRmation in Europe) que establece una infraestructura de información espacial para el ámbito de la Unión Europea, la elección del estándar ISO-19115 y la consiguiente multiplicación de iniciativas IDE en todos los ámbitos. En este contexto, se enmarca la iniciativa IDENA (Infraestructura de Datos Espaciales de Navarra) que trata de dotar al SITNA de aquellas características de las que carecía: Catálogo de Meta información, Interoperabilidad con otras IDE y Distribución. El presente artículo describe con detalle el planteamiento general del proyecto IDENA así como la problemática derivada de la integración de los metadatos en un Sistema de Información Territorial como el de Navarra.

1 2 3 4

Director del Departamento de Ingeniería Analista SIG Senior (Departamento de Ingeniería) Analista SIG (Departamento de Ingeniería) Jefe del Área Internet (Departamento de Ingeniería)

1

1. Introducción Como es bien sabido, INSPIRE es una iniciativa de la Comisión Europea1 que tiene como finalidad impulsar la creación de una Infraestructura de Información Espacial Europea, estableciendo qué información geográfica es pertinente, con unas condiciones de armonización y calidad al servicio de la formación, aplicación, seguimiento y evaluación de las políticas comunitarias con una dimensión o impacto territorial. La situación general de la Información Espacial en Europa es de una gran fragmentación de dataset y fuentes, vacíos en la disponibilidad, falta de armonización entre dataset de diferentes escalas geográficas y duplicación de colecciones de información. Estos problemas hacen difícil la identificación, el acceso y el uso de los datos que están disponibles. Para solucionar estos problemas y cumplir con los principios de INSPIRE, se hace imprescindible la documentación de todos los datos espaciales existentes en una IDE con el fin de que sus características sean conocidas. De esta manera se consigue el principal objetivo de una IDE: DESCUBRIR, ACCEDER, USAR la información geográfica. La clave de todo esto son los metadatos. El modelo SITNA es el de un Sistema de Información corporativo que trata de ofrecer servicios concretos y avanzados de consulta, análisis y gestión a los distintos perfiles de usuario identificados diseñando herramientas apropiadas para cada uno de ellos. A pesar de ello, Navarra no disponía de una Infraestructura de Datos Espaciales entendida dentro del marco INSPIRE por diversos motivos, fundamentalmente: -

No disponía de un catálogo completo de datos espaciales con sus correspondientes metadatos.

-

No permitía obtener (gratuitamente o mediante pago) dicha información (datos y metadatos) a través de Internet.

-

El SITNA no estaba configurado en términos de interoperabilidad.

Estas deficiencias apuntadas condujeron a un replanteamiento del Sistema para que permitiera, manteniendo el funcionamiento y las herramientas actuales, recoger los conceptos contemplados por INSPIRE para el desarrollo de IDE, así como las iniciativas que ya estaban en marcha, estableciendo los objetivos y los pasos a seguir para desplegar IDENA (Infraestructura de Datos Espaciales de NAvarra)2. Este artículo se centra en una de las cuestiones centrales de toda IDE, los metadatos, y su tratamiento dentro de IDENA.

2. Metadatos 2.1

Definición

La definición más habitual de los metadatos es la que dice que son “datos sobre los datos”. Describen el contenido, la calidad, la condición y otras características de los mismos. Ayudan a una persona a localizar y entender los datos espaciales disponibles. En definitiva, se debe pensar en los metadatos espaciales como en una leyenda, mucho más detallada que la del mapa en formato papel, que describe a las personas que han producido los datos, las fuentes documentales utilizadas en la producción, los atributos que poseen los datos, la fecha de publicación, el sistema de referencia, la frecuencia de mantenimiento... INSPIRE menciona que los metadatos han de ser mantenidos al día por una autoridad responsable de los datos, y han de presentar un perfil compatible con el estándar de metadatos ISO19115 (obligatorio dentro de INSPIRE). Volveremos más adelante sobre esta cuestión. 2.2

Funciones

Las principales funciones de los metadatos son las siguientes: -

1

Organizar los datos para conseguir que los usuarios los conozcan mejor y, en consecuencia, los utilicen, evitando duplicaciones y detectando errores. Todo esto ayuda a mantener la inversión en los datos.

Por el momento INSPIRE sólo tiene la forma de propuesta de Directiva.

2 El prototipo de IDENA fue presentado en las jornadas JIDEE’04 de Zaragoza y ahora se trabaja activamente en su puesta a punto para su salida oficial en los primeros meses de 2005.

2

-

Facilitar la transferencia de los datos al aportar información sobre formatos de archivos, volumen, localización, etc.

-

Permitir una distribución en línea de los datos incorporando direcciones para descargar archivos, ya sean gratuitamente o previo pago, mediante unas descripciones de cómo realizar estos procesos.

-

Facilitar la búsqueda de datos en una compleja base de datos corporativa. Unos metadatos estándares permiten a un usuario hacer una consulta, que es redireccionada a los diferentes catálogos de metadatos registrados en el servidor principal. El resultado es un listado de metadatos procedentes de diferentes servidores.

-

Evitar el uso erróneo de los datos al incluir descripciones de cómo se crearon, con qué finalidad y cómo se deben utilizar.

-

Asegura la integridad de los datos así como la seguridad de los mismos.

3. El estándar de metadatos ISO 19115 “Geographic information – Metadata” [2] 3.1

Introducción

Para que los metadatos se puedan compartir entre los diferentes productores y usuarios, deben ser comprensibles por todos ellos. Para ello, se han diseñado los estándares de metadatos que pretenden poner en común los puntos de vista de los distintos actores implicados en la información espacial para que esta documentación sea comprensible para todos, es decir, para que todos “hablemos el mismo idioma”. La International Organization for Standardization es una federación de organismos nacionales de estandarización. Éstos reciben también la colaboración de organizaciones internacionales, sean o no gubernamentales. Esta organización está dividida, internamente, en comités técnicos encargados de elaborar estándares para diferentes temáticas. El comité que ha elaborado este estándar es el ISO/TC 211, destinado a la información geográfica. Además del estándar de metadatos, existe una extensa lista de otros estándares relacionados con la información geográfica. 3.2

Objetivos

El estándar ISO 19115 tiene como principal objetivo proporcionar una estructura definitiva y única para describir datos geográficos digitales. Este estándar define los elementos de los metadatos, proporciona un esquema y establece un conjunto común de terminología de metadatos y definiciones. La implementación de este estándar: -

proporcionará a los productores de los datos la información necesaria para describir correctamente sus datos.

-

facilitará la organización y el mantenimiento de los metadatos de datos geográficos.

-

permitirá a los usuarios utilizar los datos geográficos de una forma más eficiente, porque conocerán sus características básicas.

-

facilitará el descubrimiento, la recuperación y la reutilización de los datos. A los usuarios les será más fácil localizar, acceder, evaluar, adquirir y utilizar los datos.

-

permitirá a los usuarios determinar si los datos geográficos son útiles para ellos.

Una parte de dicho estándar atiende específicamente el caso de las imágenes ráster (ISO19115-2: “Geographic Information- Metadata for imaggery and gridded data”), debido a las necesidades que su proceso de producción tiene de ser documentado para mantener los controles de calidad en los productos finales. Por otro lado hay que mencionar también la importancia del estándar ISO19139: “Geographic Information – Metadata- XML schema implementation”, que define cómo se deben codificar los metadatos ISO19115 sobre XML (formato de exportación de metadatos), este estándar no está finalizado en la actualidad, aunque se prevé que quede cerrado a finales del presente año. Finalmente, el ISO Core comprende un conjunto de metadatos del estándar ISO19115 que son considerados como más fundamentales o importantes en la documentación de los datos espaciales. Se trata con ello de permitir la posibilidad de acortar la tarea de catalogación de metadatos, que sería muy extensa si se atiende a los 401 ítems del estándar, muchos de los cuales son demasiado específicos o difíciles de conocer.

3

4. IDENA: Una IDE para Navarra 4.1

Qué entendemos por una IDE

Una Infraestructura de Datos Espaciales persigue identificar y poner a disposición de todo el mundo la información geográfica de que dispone, debidamente documentada a través de metadatos estandarizados. Desde ese punto de vista se entiende, por tanto, que las IDE constituyen verdaderos catálogos de productos cartográficos disponibles a través de Internet, que permiten al usuario acceder y obtener información geográfica y que buscan la interoperabilidad con otras IDE a todos los niveles (local, regional, nacional, internacional...). Básicamente se puede decir que una IDE está formada por una base de metadatos, con un catálogo cuyo interfaz de consulta es común al de otras IDE así como herramientas de consulta. Todo esto permite localizar qué datos y servicios hay disponibles con unas características similares, sobre un tema en concreto, en una ubicación espacial determinada. En definitiva, consultar los metadatos de lo que nos interesa ofreciendo al mismo tiempo la posibilidad de visualizarlo. Todo esto facilita enormemente una utilización correcta de la información. La iniciativa IDENA (Infraestructura de Datos Espaciales de Navarra) se pone en marcha a lo largo de 2004 para complementar y dotar al Sistema de Información Territorial de Navarra (SITNA) de aquellas características de las que carecía: Catálogo de Meta información, Interoperabilidad con otras IDE y Distribución. IDENA será la Infraestructura de Datos Espaciales de Navarra, que cumplirá con los objetivos marcados por INSPIRE para la elaboración de IDE regionales y será interoperable con otras IDE, como la Española o la Europea. Por lo tanto, deberá disponer además de los elementos tecnológicos necesarios y proporcionar los datos geográficos contemplados por INSPIRE. 4.2

Objetivos de IDENA

El objetivo principal de IDENA por consiguiente es proporcionar acceso a través de Internet a la información geográfica del Sistema de Información Corporativo de Navarra de un modo integrado y abierto. Se pueden enunciar una serie de objetivos no menos importantes que se derivan de éste primero. A nivel de datos: 1.

Documentación de toda la información del Sistema según un perfil de metadatos definido a partir de estándares.

2.

Hacer posible la búsqueda de información a partir de unos criterios de búsqueda determinados (estos criterios se basan en la directiva INSPIRE) a través de un catálogo de metadatos (Servicio de localización)

3.

Permitir la visualización gratuita de los resultados de nuestras búsquedas, tanto los metadatos como los datos (Servicio de visualización)

4.

Ofrecer la descarga gratuita de los datos básicos que se consideren (Servicio de descarga)

5.

Facilitar la adquisición de datos de pago mediante comercio electrónico (Servicio de compra)

A nivel de componentes: 1.

Desarrollo de un visualizador de mapas (Map Viewer)

2.

Implementar servicios de acceso a servicios de datos espaciales.

3.

Desarrollo de un servidor de features (WFS), de un servidor de coberturas (WCS) de un servidor de mapas (WMS)

Todo esto respetando los estándares y protocolos recomendados por INSPIRE (ISO 19100 y Open Geospatial Consortium) para interoperar con otras IDE de diferentes niveles (nacional, internacional, etc.)

5. Los metadatos en IDENA 5.1

Planteamiento general

Entre los objetivos que se persiguen a corto plazo ya hemos dicho que está el ofrecer al usuario de SITNA y al ciudadano en general, la posibilidad de buscar e identificar con precisión los datos existentes en el almacén SITNA, y alcanzar un nivel básico de interoperabilidad que abra los datos de IDENA a cualquier otra IDE.

4

Figura 1: Esquema del planteamiento del servicio de catálogo de metadatos de IDENA

Esta figura muestra un esquema que recoge todo el planteamiento comentado en los apartados anteriores, y que a continuación detallaremos:

5.2

-

En un primer lugar está la función de creación de metadatos para todos los datos existentes en SITNA. Esta tarea será realizada por el administrador de metadatos, de acuerdo al perfil IDENA (que se comentará en detalle en sucesivos apartados), y mediante el uso combinado de dos herramientas: ArcCatalog y CatMDEdit (la primera de ellas permitirá extraer del dato algunos de sus atributos espaciales como el formato, el número de objetos, etc.; a través de la segunda podremos completar con más detalle el resto de metadatos).

-

Una vez creados los registros de metadatos, éstos son exportados desde CatMDEdit a formato XML (formato de intercambio de metadatos), son almacenados y pasan a formar parte de un catálogo de metadatos.

-

El usuario de IDENA podrá realizar búsquedas según unos criterios definidos (Buscador de Metadatos). Estas búsquedas se realizarán sobre el catálogo de metadatos, y los resultados se mostrarán con una visualización siguiendo un estilo específico de IDENA mediante la utilización de hojas de estilo (XSL). Estas hojas de estilo serán de dos tipos: una general y otra específica (proporcionando los metadatos más importantes o destacados la primera, y todos los que establece el perfil IDENA, la segunda).

Estructura y modelo de explotación

El almacén de información SITNA posee una estructura capa-objeto y así se comprueba en todas sus herramientas de explotación (web, visores). Las capas (dataset) son agrupaciones de objetos según criterios fundamentalmente temáticos y de titular de la información (ejemplo: catastro sería la capa y las parcelas, polígonos, etc. sus objetos). Desde este punto de vista, los objetos se constituyen como el elemento esencial de la información territorial. Sin embargo, esta división no es tan clara cuando se tratan de documentar series cartográficas (problema objeto-hoja), problema recurrente cuando se habla de metadatos, o cuando el nivel de profundidad que se quiere utilizar es distinto según capas. Las capas de información cargadas son de tipo muy diverso, desde cartografía a diversas escalas, pasando por datos de planeamiento, medio ambiente, catastro, direcciones postales, divisiones administrativas, agricultura, etc. y, por supuesto, las imágenes ráster. Puede haber capas de información mucho más ricas o conocidas que otras, lo que obliga a estructurar la información en distintos niveles. De todas formas, y como norma general, se considera necesario estructurar la meta información del SITNA en capas (o niveles padre) y objetos (o niveles hijo) con 5

distintos niveles de agregación. La figura siguiente nos muestra algunos ejemplos de dataset existentes y la estructura que se va a adoptar. La herramienta de creación de metadatos permite indicar a qué nivel jerárquico superior pertenece cada dato y, al mismo tiempo, cuáles son los que cuelgan de dicho nivel. Lo que se pretende es que siempre que un determinado dato posea mayor nivel de desagregación, la aplicación cliente del catálogo le de la posibilidad de ‘ver los agregados’ y luego, de cada uno de ellos, los metadatos básicos y los detallados. El mayor problema radica aquí en la determinación de la estructura de los datos de SITNA, es decir, determinar cuáles son los padres y cuáles sus agregados. De todas formas el buscador de metadatos contempla la posibilidad de buscar una información sin necesidad de que el usuario conozca su localización dentro de la estructura de SITNA.

Figura 2: Estructura del almacén de metadatos de IDENA (ejemplo para algunos datos).

El buscador, según los criterios de búsqueda establecidos por el usuario, ofrece como resultados las “capas” (ver estructura de la figura anterior) que cumplen esos criterios. Cada capa ofrece información de los objetos que comprende, y la posibilidad de acceder a los mismos. 5.3

Herramienta

En un primer momento, se decidió elegir la herramienta ArcCatalog de ESRI, basada también en el estándar ISO 19115, y así se comenzó la tarea de documentar los datos de Medio Ambiente. Posteriormente, con motivo del mayor interés por las IDE, se dieron a conocer otras herramientas y se consideró realizar un análisis de las ventajas e inconvenientes de utilizar la herramienta de libre distribución que el Instituto Geográfico Nacional estaba desarrollando para la IDE española, el CatMDedit, frente a ArcCatalog. Como principales ventajas: -

CatMDEdit tiene una mayor interoperabilidad con otras IDE que utilicen la misma herramienta (entre ellas la IDE española). Esta interoperabilidad está entendida en cuanto a que cualquier cambio en los estándares ISO 19139 e ISO19115-2 (todavía no definitivos) que pudiera repercutir en la herramienta, será cambiado en un corto plazo de tiempo, y los mismos inconvenientes que podamos tener en la catalogación, serán encontrados en otras comunidades. Por otro lado, ArcCatalog utiliza actualmente una versión desfasada del estándar ISO19115, lo que significaría que los metadatos creados con dicha herramienta no serán entendidos por otras herramientas con la versión actualizada del estándar.

-

La herramienta CatMDEdit aporta tesauros, con un interfaz amigable para su utilización. ArcCatalog, aunque dispone de un apartado para introducir palabras clave y especificar los tesauros de donde proceden (cuando proceden de alguno), no aporta ningún tesauro en la herramienta, teniendo que realizar una búsqueda en Internet o en otras bases de datos, lo que ralentiza el proceso de creación de metadatos.

-

Esta herramienta es muy extensa y recoge la mayoría de los metadatos de la norma ISO19115, resultando, por lo tanto, muy precisa.

Como principales inconvenientes:

6

-

No hay una relación directa de los datos con los metadatos. En ArcCatalog hay algunos metadatos que se actualizan automáticamente según son actualizados los datos.

-

Esta falta de relación directa entre los datos y los metadatos hace que en la versión simple de la herramienta CatMDEdit (la que se distribuye desde el IGN), no se pueda extraer automáticamente cierta información de los datos, como las coordenadas límite, el sistema de referencia y el sistema de coordenadas, los conjuntos de caracteres de los datos y de los metadatos, etc.

-

El CatMDEdit resulta una herramienta complicada en cuanto a la diversidad de campos que hay para completar, mientras que el editor de ArcCatalog contenía menos campos de información, y además no mostraba la información que extraía directamente de los datos.

Después de valorar las ventajas y desventajas, se optó por utilizar la herramienta CatMDEdit (aunque en combinación con ArcCatalog), puesto que las ventajas tenían más peso que las desventajas y, algunas de éstas últimas, se podrían solventar fácilmente.

5.4

-

La falta de relación entre los datos y los metadatos ha sido solventada mediante la creación de una pasarela entre ambas aplicaciones. De esta manera, primero se crea el registro de metadatos en ArcCatalog, extrayendo la información gráfica de los ficheros, posteriormente, se exporta a CatMDEdit, en donde se completan los metadatos. Este hecho solventa los dos primeros guiones de inconvenientes.

-

En cuanto a la mayor complejidad de la herramienta CatMDEdit por la densidad de campos, vendría solventada con la utilización del perfil de catalogación de metadatos de IDENA, descrito en el apartado anterior, o por el NEM (Núcleo Español de Metadatos), que simplificarían en gran medida la tarea de creación de metadatos. Descripción del perfil

Los metadatos descritos en el estándar ISO19115 son muy numerosos y plantean una documentación muy extensa de los datos lo que podría llevar al desánimo y al riesgo de limitar el avance en la creación. El problema es, por una parte, que se trata de un estándar muy general que ha de ser útil en cualquier disciplina relacionada con el territorio y en cualquier país; por otra, que muchos de estos elementos no se utilizarán nunca. Por ello se plantea la necesidad de recomendar un núcleo más limitado, de forma que, aún sirviendo para recopilar información básica para las búsquedas más habituales, evite la necesidad de excesivo esfuerzo en la creación de metadatos. Desde el SG NEM (Subgrupo de Trabajo del Núcleo Español de Metadatos), para la Infraestructura de Datos Espaciales de España (IDEE), promovido por el Grupo de Trabajo de la IDEE, del Consejo Superior Geográfico, se está trabajando intensamente en la definición del perfil NEM [4]. NEM es el acrónimo de Núcleo Español de Metadatos, un conjunto mínimo de ítems de metadatos, recomendado para su utilización en España a la hora de elaborar metadatos de datos geográficos, que se basa en el núcleo de la norma ISO19115 de Metadatos, en el Dublin Core Metadata, en los elementos de descripción de la Calidad y en otros elementos adicionales considerados de interés en la catalogación. Se puede ver una descripción detallada en: http://idee.unizar.es/resources/CSG_IDEE_SGT3_Recomendaciones_Metadatos.doc De la misma manera que se está estableciendo este núcleo para la IDEE, el perfil IDENA establece qué campos han de configurar el núcleo IDENA de Metadatos (qué campos resultan más relevantes para el usuario, qué campos son los necesarios para realizar búsquedas, etc.). El planteamiento IDENA de metadatos parte del reconocimiento de la conveniencia de adoptar el NEM y completarlo según las propias necesidades. De esta manera se ha definido provisionalmente el Núcleo IDENA de Metadatos: Núcleo IDENA de Metadatos = Núcleo Español de Metadatos (ISO Core 19115+Dublin Core+Calidad + Elementos adicionales NEM)+ Elementos adicionales IDENA En definitiva se trata del NEM junto con una serie de elementos adicionales que se han estimado importantes para la información SITNA. Esto significa que en la medida que el NEM no se apruebe definitivamente o se modifique con posterioridad, el perfil IDENA de metadatos tendrá que recogerlo.

7

Figura 3: El perfil de metadatos IDENA

La propuesta del perfil de IDENA de Metadatos consta de: •

22 elementos del ISO Core: •

7 son obligatorios, es decir, no se podrán considerar válidos los metadatos que no recojan al menos información de estos campos (marcados como M en la tabla de la página siguiente).



15 son opcionales (marcados como O y C en la tabla de la página siguiente).



4 elementos adicionales que forman parte del Dublin Core pero que no tienen correspondencia con ningún elemento del ISO Core.



Elementos de calidad (a fecha 21/01/05 hay definidos 9). El motivo de esta inclusión es que el elemento ‘Lineage’ del ISO Core, no resulta suficiente para determinar la calidad de un dato.



Elementos adicionales del perfil NEM. A falta de cerrar el perfil NEM, trata de 3 elementos.



Elementos adicionales correspondientes a las necesidades de la información SITNA.

De esta manera nos encontramos con 38 elementos pertenecientes al NEM más los específicos de IDENA que haya que añadir. A continuación se hace una revisión más detallada de todos los elementos que comprenden el perfil IDENA.

6. Elementos del perfil 6.1

El Core ISO 19115 [2]

El estándar internacional define un conjunto de elementos de metadatos muy extenso, pero a la hora de la verdad, el conjunto de elementos utilizado es muy reducido. No obstante, es esencial que se utilice un número básico de elementos del metadato. A continuación, se muestra el núcleo principal del estándar (el Core), el mínimo imprescindible para documentar los datos. (M) son los obligatorios; (O) los opcionales y (C) los condicionales.

Dataset title (M)

Spatial representation type (O)

(MD_Metadata > MD_DataIdentification.citation >

(MD_Metadata >

CI_Citation.title)

MD_DataIdentification.spatia

Dataset reference date(M)

Reference system(O)

lRepresentationType)

8

(MD_Metadata CI_Citation.date)

>

MD_DataIdentification.citation

>

Dataset responsible party(O)

(MD_Metadata > MD_ReferenceSystem) Lineage(O)

(MD_Metadata > MD_DataIdentification.pointOfContact CI_ResponsibleParty)

>

Geographic location of the dataset (by four coordinates or geographic identifier) (C) (MD_Metadata MD_DataIdentification.extent > EX_Extent EX_GeographicExtent > EX_GeographicBoundingBox EX_GeographicDescription)

by > > or

(MD_Metadata > DQ_DataQuality.lineage > LI_Lineage) On-line resource (O) (MD_Metadata > MD_Distribution > MD_DigitalTransferOption.onLine > CI_OnlineResource)

Dataset language (M)

Metadata file identifier (O)

(MD_Metadata > MD_DataIdentification.language)

(MD_Metadata.fileIdentifier)

Dataset character set(C)

Metadata standard name (O)

(MD_Metadata > MD_DataIdentification.characterSet)

(MD_Metadata.metadataStandardName)

Dataset topic category (M)

Metadata standard version(O)

(MD_Metadata > MD_DataIdentification.topicCategory)

(MD_Metadata.metadataStandardVersion)

Spatial resolution of the dataset (O)

Metadata language (C)

(MD_Metadata > MD_DataIdentification.spatialResolution > MD_Resolution.equivalentScale or MD_Resolution.distance)

(MD_Metadata.language)

Abstract describing the dataset (M)

Metadata character set (C)

(MD_Metadata > MD_DataIdentification.abstract)

(MD_Metadata.characterSet)

Distribution format (O)

Metadata point of contact (M)

(MD_Metadata > MD_Distribution > MD_Format.name and MD_Format.version)

(MD_Metadata.contact > CI_ResponsibleParty)

Additional extent information for the dataset (vertical and temporal) (O) (MD_Metadata > MD_DataIdentification.extent > EX_Extent > EX_TemporalExtent or EX_VerticalExtent)

Metadata date stamp (M) (MD_Metadata.dateStamp)

Tabla 1: ISO Core3

A continuación, se muestra una descripción de cada uno de esos campos, con el fin de servir de base para la guía de usuario: -

Dataset title: Nombre mediante el cual el recurso citado es conocido. En caso de tener que asignarle un nombre, éste se creará teniendo en cuenta la temática de los datos y su localización geográfica.

-

Dataset reference date: Fecha de referencia para el recurso citado. Se considerará como fecha de referencia la fecha de creación del recurso (fecha del último día, en el que se ha finalizado la creación, en el caso de que esta tarea haya tenido lugar durante un periodo de tiempo o que haya habido sucesivas actualizaciones), salvo excepciones concretas (como las fotografías aéreas, para las cuales se utilizará la fecha de vuelo). Cuando únicamente se conozca el año, se pondrá el primer día del primer mes de ese año, y cuando sólo se conozca el mes y el año, se pondrá el primer día de ese mes y ese año.

-

Dataset responsible party: Nombre, información de posición y datos de contacto para la persona u organización que es responsable del recurso. Hay que determinar dos aspectos: •

3

Editor: será la persona u organización que publicó la información

Fuente: The OpenGISTM Abstract Specification. Topic 11: OpenGISTM Metadata (ISO/TC 211 DIS 19115). Versión 5.

9

• -

Productor: será la persona u organización que creó los datos, o el último que los modificó.

Geographic location of the dataset (by four coordinates or by geographic identifier): Se plantean dos opciones: •

Posición geográfica del dataset. Se trata de 4 campos de información, correspondientes con las 4 coordenadas limítrofes (norte, sur, este y oeste).



O se podrían introducir palabras claves de lugar (basadas en un tesauro) para representar un área geográfica.

-

Dataset language: Lenguaje o lenguajes empleados en el dataset.

-

Dataset character set: Nombre completo del estándar de codificación de caracteres usado para el dataset.

-

Dataset topic category: Tema/s principales del dataset.

-

Spatial resolution of the dataset: Se puede elegir entre completar dos campos de información: •

Escala: escala del dataset.



Distancia: longitud de un lado de un píxel.

-

Abstract describing the dataset: Breve resumen del contenido del recurso.

-

Distribution format: Se solicitan dos elementos: el nombre del formato de transferencia de datos y la versión de dicho formato (fecha, número, etc.).

-

Additional extent information for the dataset (vertical and temporal): Se puede aportar información relativa a una de estas dos:

-



Fecha del contenido del dataset (periodo de tiempo cubierto por el contenido del dataset: fecha de inicio y fecha de fin).



Dominio vertical del dataset: ƒ

Valor mínimo (extensión vertical más baja contenida en el dataset)

ƒ

Valor máximo (extensión vertical más alta contenida en el dataset)

ƒ

Unidad de medida (unidades verticales usadas para la información de extensión vertical, como metros, pies, milímetros, etc.)

ƒ

Datum vertical (suministra información sobre el origen para el cual los valores máximos y mínimos de elevación son medidos)

Spatial representation type: Método usado para representar espacialmente la información geográfica. Elegir una opción de la lista controlada (vector, malla, tabla de texto, TIN, modelo estéreo o vídeo), según la opción elegida será necesario aportar un tipo de información u otro (si es vector o malla). •



Vector: ƒ

Nivel de topología: elegir un término de la lista controlada, que definirá el grado de complejidad de las relaciones espaciales.

ƒ

Objetos geométricos: tipos de objetos geométricos usados en el dataset (se trata de especificar qué tipo de geometría tiene: polígono, punto... elegir de la lista controlada que proporciona el estándar).

ƒ

Número de objetos geométricos: número de objetos del dataset para cada tipo definido.

Malla (ráster): ƒ

Número de dimensiones: número de ejes espacio-temporales diferentes (valores posibles: 1; 2; 2,5 y 3).

ƒ

Geometría de la celda: especificar si se trata de puntos o de celdas (píxeles).

ƒ

Número de filas.

ƒ

Número de columnas.

ƒ

Conteo vertical. 10

-

Reference system: Información sobre el sistema de referencia, el datum, el elipsoide y la proyección (se trata solo de definir cada uno, si se puede, aportar más información).

-

Lineage: Contiene información sobre los eventos o datos de origen usados en la construcción del dato. Engloba información respecto: •

Declaración (statement): Explicación general del conocimiento del productor de datos del linaje de un conjunto de datos.



Pasos del proceso: información sobre los eventos o transformaciones en la vida del dataset incluyendo los procesos usados para su mantenimiento. Hay que aportar información descriptiva del proceso, información de la fecha y hora (de finalización) en que tienen lugar los diferentes procesos, identificación de la persona u organización asociada con el proceso y las fuentes utilizadas.



Fuentes utilizadas: información sobre los datos de origen utilizados en la creación del dato. Hay que aportar información descriptiva de las fuentes, el denominador de la escala y la mención de la fuentes.

-

On-line resource: Información sobre las fuentes on-line a través de las cuales el dataset puede ser obtenido, hay que mencionar la URL de ubicación del dato y una descripción detallada de lo que hace el recurso on-line.

-

Metadata file identifier: Identificador único para cada fichero de metadatos.

-

Metadata standard name: Nombre del estándar de metadatos usado (“ISO 19115 Geographic information – Metadata”).

-

Metadata standard version: Versión del estándar de metadatos usado (por ejemplo “2003” si se está utilizando la última versión del ISO19115).

-

Metadata language: Lenguaje usado para documentar los metadatos.

-

Metadata character set: Nombre completo del estándar de codificación de caracteres usado para el conjunto de metadatos.

-

Metadata point of contact: Persona u organización que sea punto de contacto de los metadatos (serán los creadores de los metadatos). Se trata de un conjunto de campos de información.

-

6.2

Metadata date stamp: Fecha de creación de los metadatos. En caso de que los metadatos se hayan realizado a lo largo de un periodo de tiempo, la fecha será la del último día o día de finalización. Siempre que se realicen actualizaciones de los metadatos, se actualizará esta fecha.

Elementos Dublin Core [3]

Hay 4 elementos contemplados en el estándar Dublin Core, que no tienen correspondencia con los elementos recogidos en el ISO Core (aunque si encontrarían correspondencia con elementos del ISO19115). El Dublin Core es un estándar para creación de metadatos de recursos en general, no únicamente de información geográfica. Este estándar contiene 16 elementos, 11 de los cuales tienen correspondencia con los elementos del ISO Core, pero los otros 5 no, por lo tanto se deberían de acoger en el perfil IDENA. Estos 5 elementos son: -

Colaborador: Contributor (se correspondería con el elemento Créditos del ISO 19115): Reconocimiento de aquellas personas que han contribuido de una manera o de otra en la creación o modificación del dato (aportando medios económicos, trabajo, soporte, etc.).

-

Relación: Relation (se correspondería con el elemento Información de agregación del ISO 19115): Relación a un recurso relacionado. La información que hay que aportar es la siguiente: •

Información sobre el dataset agregado.



Mención de la información sobre el dataset agregado.



Tipo de asociación: tipo de asociación del dataset agregado. (Ni idea de a qué se refiere).

11

• -

-

6.3

Tipo de iniciativa: tipo de iniciativa bajo la cual el dataset agregado ha sido producido.

Derechos Rights Management (se correspondería con el elemento Información de Constricciones / Restricciones legales): Información a aportar: •

Restricciones de acceso: restricciones de acceso aplicados a asegurar la protección de privacidad o propiedad intelectual, y cualquier restricciones especiales o limitaciones para obtener el recurso.



Restricciones de uso: en este caso hay que tener en cuenta además cualquier peligro o riesgo que pudiera suceder en el uso del dato.



Otras restricciones: otras restricciones o prerrequisitos legales para el acceso y el uso del dato.



Restricciones legales: ƒ

Clasificación: tipo de restricción aplicado al recurso (elegir de la lista controlada).

ƒ

Descripción: información adicional sobre las restricciones aplicadas al dato.

Tipo: Type (se correspondería con el elemento Nivel de jerarquía): Naturaleza o género del contenido del recurso. El tipo incluye términos que describen categorías generales, funciones, géneros o niveles agregados para el contenido.4

Elementos de calidad

El estándar ISO19115 recoge información de los informes de calidad realizados a los datos. Estos informes son de gran importancia para determinar qué controles de calidad se les ha pasado a los datos. En algunos casos estos procesos se tienen más controlados porque están generalizados o se incluyen en el propio proceso de elaboración de los datos, y/o además se elaboran informes (como en la cartografía o las fotografías aéreas), pero en otros casos no se tiene constancia de los controles que han pasado los datos. Un dataset puede tener uno o varios informes de calidad, que pueden ser de los siguientes tipos: -

Comisión: Exceso de datos en el fichero.

-

Omisión: Falta de datos en el fichero.

-

Consistencia lógica: Grado de adherencia a las reglas lógicas de estructura de datos, atributos y relaciones.

-

Exactitud posicional: Exactitud de la posición de los objetos.

-

Exactitud temática: Exactitud de atributos y relaciones. Determina la fidelidad de los valores de los atributos, como nombre, longitud, código de clase, población, etc., asignados a los objetos con respecto al valor verdadero de la característica que presentan.

-

Exactitud temporal: Exactitud de los atributos y relaciones temporales.

De cada uno de estos tipos de informes que se determinen, se deberá especificar lo siguiente:

6.4

-

Nombre de la medida: Nombre de la prueba hecha sobre los datos.

-

Descripción de la medida: Descripción de la prueba hecha sobre los datos.

-

Resultado: Valor obtenido al realizar una medida de calidad de los datos o, conformidad con un nivel de calidad aceptable.

Elementos adicionales NEM

Además de los elementos anteriormente mencionados, el NEM incluirá otros 3 adicionales, considerados importantes por la información que proporcionan sobre el dato:

4

Este elemento es útil para determinar si un recurso es un dato agregado o no, y si lo es, qué nivel de agregación presenta (si es una serie o una hoja, un dataset o un objeto, un atributo...).

12

-

Palabras clave de tema y de lugar. Palabra/s usadas para describir el tema o el lugar correspondiente al dataset. Nombre del tesauro formalmente registrado o una autoridad similar fuente de palabras clave. En cuanto a las palabras clave de lugar, se pondrán todas las entidades superiores, hasta el nivel mínimo (el de referencia del dato): si estamos hablando de un municipio de Navarra, se pondrán España, Navarra y el nombre del municipio, pero no, por ejemplo, el nombre de todos sus núcleos de población.

-

Forma de presentación: Modo en el cual el recurso es presentado. Hay que elegir una opción de una lista controlada, la más apropiada para el dato que se esté catalogando (este elemento, además de determinar el tipo de fichero: tabla, documento, modelo...; indica si se trata de un fichero digital o analógico).

-

Nivel: Nivel jerárquico de los datos incluidos en el ámbito. Hay que elegir una opción de una lista controlada. Esta lista controlada es la misma que la del nivel jerárquico (atributo, dataset, serie, hoja...).

6.5

Elementos adicionales IDENA

Los elementos anteriormente comentados se corresponden con el Núcleo Español de Metadatos (NEM), sin embargo, en el caso de Navarra se han establecido por el momento 7 elementos más, porque se han considerado esenciales (información de distribución) o porque en algunos casos se consideraba interesante completar esa información. Estos elementos son: -

Título alternativo: Nombre corto, nombre en otro lenguaje o acrónimo por el cual la información catalogada es conocida.

-

Identificador del padre: número de identificación del fichero de metadatos de los cuales este metadato es una parte (hijo).

-

Frecuencia de mantenimiento y actualización: Se elegirá una opción de una lista controlada que incluye todas las opciones posibles (continuamente, diariamente, no planeado, según necesidad, etc.).

-

Estado: Estado del recurso. Se elegirá una opción de una lista controlada (si está completado, en proceso, obsoleto, etc.).

-

Propósito: Resumen de las intenciones con las cuales el recurso ha sido creado.

-

Información suplementaria: Cualquier otra información descriptiva sobre el dataset.

-

Distribución. Este apartado comprendería toda la información que tiene el estándar referente a los metadatos de distribución, salvo los ya contenidos en el Core (On-line Resource y Distribution Format): •

Distribuidor. Mención de la persona u organización a través de los cuales los recursos pueden ser obtenidos (descripción del cargo que ocupa y datos de contacto).



Información del proceso de petición.



ƒ

Tarifas: tarifas y plazos para el cobro del recurso.

ƒ

Tiempo de entrega: día y hora en el que el recurso será entregado.

ƒ

Instrucciones de petición: instrucciones generales, planos y servicios suministrados por el distribuidor.

Opciones de transferencia digital: ƒ

Unidades de distribución: capas, hojas, áreas geográficas para las cuales los datos están disponibles.

ƒ

Tamaño de transferencia: tamaño estimado de una unidad en el formato de transferencia estimado, expresado en megabytes.

ƒ

Recursos Off-line: Nombre: nombre del medio en el cual el recurso puede ser recibido.

13

7. Conclusiones Este artículo se ha centrado fundamentalmente en los siguientes aspectos: -

En la determinación del flujo de trabajo con los metadatos dentro del proyecto IDENA, así como en los diferentes componentes del mismo (ver figura 1).

-

En el establecimiento de la estructura de la información de SITNA (ver figura 2) para poder atender las necesidades de IDENA y conllevar una mejor comprensión por parte de los usuarios (simplificar y estructurar los resultados de las búsquedas).

-

En la determinación de las herramientas de trabajo para la creación de metadatos.

-

En la definición del perfil de metadatos IDENA. De donde se pueden extraer las siguientes conclusiones: •

Los metadatos son un elemento esencial que debe facilitar la comunicación y el conocimiento acercando la información geográfica al ciudadano.



Los trabajos para la puesta en marcha de IDENA han puesto en evidencia la gran necesidad de que los organismos productores de información geográfica vayan conformando redes abiertas.



Navarra y su Sistema de Información Territorial (SITNA) apuestan decididamente por el mundo IDE y para ello han puesto en marcha un plan para la documentación de todo su almacén de información que se encuentra en una fase avanzada.



Es fundamental adoptar un perfil de metadatos propio que recoja el perfil NEM (Núcleo Español de Metadatos), aconsejable para todos los metadatos de datos españoles, y además otros elementos específicos para IDENA, considerados como importantes para calificar los datos de Navarra.

8. Referencias [1] Commision of the European Communities, 2004. “Proposal for a Directive of the european parliament and of the council establishing an infrastructure for spatial information in the Community (INSPIRE)”, Brussels. http://www.ec-gis.org/inspire/ [2] International Organization for Standardization, 2003. “International Standard ISO19115. Geographic information – Metadata”. www.iso.org [3] Dublin Core Metadata Initiative, 2003. “Using http://dublincore.org/documents/usageguide/elements.shtml

Dublin

Core



The

Elements”.

[4] Nogueras, J.; Rodríguez, A.; Gould, M.; Zarazaga, F.J. y Muro, P.R.; 2004. “Recomendaciones de Metadatos para la IDEE, V 1.0. http://idee.unizar.es/resources/CSG_IDEE_SGT3_Recomendaciones_Metadatos.doc

14

15

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.