Reseñas Xml Topic Maps. Creating and using Topic Maps for the web Por Piedad Garrido Picazo y Jesús Tramullas LOS TOPIC MAPS SE DESARROLLARON a finales de la década de los 90 como uno de los paradigmas más prometedores para superar los problemas de la organización de grandes espacios de información digital. El web semántico, tal y como fue soñado por Berners-Lee, había abierto el camino para buscar formas de representar la información que fuesen capaces de incorporar no sólo el contenido, sino también la semántica inherente a ellos. En realidad, cuando se estudie este momento desde una perspectiva histórica, la búsqueda de la semántica será recordada como el punto de inflexión clave para los procesos de tratamiento de la información. Y dentro de este contexto es donde cabe situar a los Topic Maps.
en el año 2000. Venía derivada de la ISO/IEC 10744 Hypermedia/Time-based Structuring Language (HyTime) (1997). Su primera versión establecía el paradigma y los elementos de los Topic Maps, usando para ello el lenguaje HyTM. Desde el punto de vista de un desarrollador web, HyTime utiliza una técnica conocida como arquitectura sgml, recogida en el Park, J. (ed.). Xml Topic Maps. Creating and using topic maps for the web. Addison-Wesley, 2003. Isbn 0-201-74960-2.
Sin embargo, es preciso aclarar previamente una cuestión que lleva a confusión. Los Topic Maps son un estándar ISO, concretamente la norma ISO 13250 Topic Maps, cuya primera versión fue presentada 156
El profesional de la información, v. 14, n. 2, marzo-abril 2005
anexo 3 de la norma ISO 10744:2 (1997) de alta complejidad y, por lo tanto, de costoso proceso de aprendizaje. Evidentemente, la formulación en sgml no se ajustaba a las necesidades de un contexto en el cual el lenguaje de etiquetado xml se estaba conformando como lingua franca. En consecuencia, la comunidad de trabajo organizada alrededor de los Topic Maps procedió a proponer una especificación formal para la sintaxis de los Topic Maps, que utilizaba xml, y que recibió la denominación de XTM (Xml Topic Maps) o lo que es lo mismo, la creación de una dtd para crear Topic Maps en xml. Esta especificación formal, en su versión 1.0, se presentó en la conferencia Xml GCA 2000, en Washington (EUA). Como consecuencia, las herramientas y plataformas de desarrollo que trabajaban con Topic Maps para la representación y el acceso a la información adoptaron la especificación XTM en lugar de la norma ISO. Como ofrecía bastantes ventajas debi-
Xml Topic Maps. Creating and using Topic Maps for the web
do a la versatilidad y sencillez de su plantilla se intentaba asegurar que todas las versiones actuales de software comercial que hubiera en el mercado soportaran ambas sintaxis, tanto la XTM como la HyTM, ya que si se llevaba a cabo una comparativa de las dos quedaba totalmente claro que existían claras e importantes diferencias entre ellas. Esta diferenciación llevó a que se redactara una segunda edición de la norma ISO 13250, presentada en 2003, que incorporaba ambas sintaxis: la primera basada en HyTM y la formulada en la especificación XTM, que utilizaba el xml. Sin embargo, esta segunda versión ha dejado en el aire varios problemas que han llevado al grupo de trabajo JTC 1 / SC 34 WG 3 de ISO a revisar la norma y a proponer una división de la misma en cinco partes completando las lagunas que ofrece. Además, se está trabajando en dos nuevas normas: la ISO 18048 (Topic Maps Query Language, TMQL) y la ISO 19756 (Topic Maps Constraint Language, TMCL). La complejidad cada vez mayor que van a ofrecer los recursos de información digital se refleja en las arquitecturas que deben soportarlos. De hecho, el esfuerzo de la ISO por la elaboración de estándares al respecto sobre Topic Maps abarca tres capas: —De modelado: comprende aspectos como el modelo de referencia (Rm), y el de aplicación del estándar (SAM). —Sintáctica: engloba las dtds y la documentación necesaria para su construcción en HyTime, en XTM y unas pautas para conseguir la sintaxis adecuada. —De restricciones y consultas: incluye TMQL y TMCL. Este continuo trabajo de normalización y la potencia y capacidad de las aplicaciones informáticas comerciales que utilizan XTM
contrasta con la parquedad de publicaciones de referencia sobre Topic Maps y XTM. Si bien es posible encontrar numerosos trabajos en congresos (especialmente en las Xml conferences y en las Extreme markup languages conference), en la colección Lecture notes in computer science, de Springer Verlag, y en los números publicados por la revista especializada Markup languages en su corta vida (19992001), las monografías y obras de referencia son escasas. Aparte de algunos capítulos concretos en obras generales sobre el web semántico, como trabajos específicos sólo cabe señalar: —Wildhalm, R.; Mück, T. Topic Maps. Semantische suche im internet. Springer Verlag, 2002. —Park, J. (ed.). Xml Topic Maps. Creating and using topic maps for the web. Addison-Wesley, 2003. Esta última se ha convertido en la obra de referencia hasta el momento y es objeto de esta reseña. XML Topic Maps. Creating and using Topic Maps for the web es un volumen en el que participa todo el “quién es quién” en este contexto (sorprendentemente, falta Lars Marius Garshol). La obra se estructura en tres partes principales: la primera de ellas dedicada a la historia y los fundamentos de organización y razonamiento; la segunda abarca aspectos técnicos relacionados con la creación de Topic Maps y herramientas de software libre disponibles para esta tarea, y una tercera parte muestra las posibilidades de aplicación y aprovechamiento de los Topic Maps en contextos específicos. La lectura debe comenzarse por la introducción general a XTM que realiza M. Biezunski (capítulo 2) que enumera los esfuerzos llevados a cabo para añadir más funcionalidad a la especificación de la norma ISO/IEC 13250 realizando
una comparativa entre la norma y XTM centrándose en el direccionamiento, el modelado conceptual subyacente, los formularios arquitectónicos versus dtds, etc. Debe tenerse en cuenta que la redacción de este libro es anterior a la segunda edición de la norma, lo que resta valor a alguna de sus secciones. Más interesante resulta el siguiente capítulo, redactado por S. R. Newcomb, que contextualiza los Topic Maps en el complejo y apasionante mundo de los metadatos. El capítulo 4 revisa la relación entre la norma ISO y la especificación XTM desde diciembre de 1999 hasta abril de 2002 destacando los hitos más significativos a lo largo de este período de su ciclo de vida, por lo que su interés, en el momento actual, es limitado. Realmente, la obra entra en materia a partir del capítulo 6, redactado por S. Hunting, que desempeña el papel de tutorial introductorio a XTM. A partir de este punto es necesario que el lector conozca las características y sintaxis de los lenguajes de etiquetado basados en xml. Es uno de los mejores y más claros tutoriales de iniciación al XTM que pueden encontrarse, tanto en formato papel como digital, al que sólo puede y debe reprocharse su brevedad. En la actualidad resulta más completo y recomendable como introducción el capítulo 3 de Passin, T. B. (Explorer’s guide to the semantic web. Manning, 2004). Para el lector que se ha preguntado por las herramientas de clasificación y descripción que deben acompañar a XTM llega el capítulo 7, dedicado a las ontologías, que resulta una introducción a las mismas, así como a su utilización combinada con los Topic Maps. Esta combinación es una de las vías principales para reflejar la semántica que acompaña a los recursos de información digital. Además, este capítulo tiene como valor añadido
El profesional de la información, v. 14, n. 2, marzo-abril 2005
157
Piedad Garrido Picazo y Jesús Tramullas
terminar con una selecta y abundante bibliografía muy recomendable (pp. 134-148). De igual interés resulta el capítulo 9, de N. Ogievetsky, dedicado a la creación de sedes web utilizando Topic Maps y XSLT. En estas páginas el autor entra en materia sobre el código y las herramientas necesarias para construir sedes web dinámicas usando para ello información etiquetada en XTM y presentada al usuario final en formato de página web, que ha sido tratada mediante XSLT. El bloque técnico (según el editor) del volumen acaba con un interesantísimo, a nuestro juicio, capítulo dedicado a las herramientas de software libre disponibles para la creación y visualización de Topic Maps, con un tamaño notable (pp. 199265). Se analizan las prestaciones, ventajas e inconvenientes que ofrecen cuatro plataformas: —Semantext: prototipo de aplicación desarrollado para demostrar cómo se puede hacer uso del estándar ISO/IEC 13250:2000 para la representación de redes semánticas. —TM4J (Topic Maps 4 Java): el objetivo del proyecto es el del desarrollo robusto de herramientas opensource para la creación, manipulación y publicación de Topic Maps. —Nexist: proyecto software específicamente diseñado con la intención de explorar arquitecturas OHS (Open Hyperdocument System). —GooseWorks Toolkit: presentado en la 2001 Xml conference, es una herramienta open-source que suministra la mayoría de los bloques necesarios para la implementación del modelo de procesamiento de Topic Maps. El lector debe considerar que, en el tiempo transcurrido desde la redacción de estos apartados, las herramientas han evolucionado, y existen nuevas versiones que ofrecen prestaciones más avanzadas que las originalmente analizadas. 158
De la misma forma, han cambiado algunas de las urls de referencia indicadas en el libro. Debe tenerse en cuenta que el trabajo con Topic Maps, aunque el usuario puede estar acostumbrado sobre todo a la visualización gráfica final, demanda previamente un completo trabajo de tratamiento de información que en muchas ocasiones pasa totalmente desapercibido. Aunque el editor de la obra coloca los capítulos 11 y 12 dentro del bloque de aplicaciones, consideramos que, en realidad, siguen perteneciendo a la parte técnica, ya que tienen un mejor engarce con los capítulos anteriores que con los posteriores. El capítulo 11, dedicado a visualización y redactado por B. Le Grand, no está a la altura del resto del contenido técnico, ya que apenas muestra unos ejemplos conocidos de visualización de Topic Maps. Un poco más extenso pero en la misma línea está el capítulo escrito por el mismo autor y por M. Soto en: Geroimenko, V.; Chen C. (eds.) (Visualizing the semantic web. Xml-based internet and information visualization. Springer Verlag, 2003). Desmerece esta limitación en las interfaces visuales frente al resto del contenido del libro que nos ocupa. Las líneas de investigación en interfaces visuales que superen los problemas de representación de grandes volúmenes de información han adoptado, en muchos casos, esquemas basados en XTM. Si se compara con los ejemplos recogidos en Kahn, P. (Mapping website: digital media design. Rockport, 2001), este apartado clave no alcanza la profundidad y detalle que merece. Por contra, es bastante apreciable el capítulo 12, dedicado a la relación con RDF (Resource Description Framework), escrito por E. Freese. Se muestran las semejanzas y las diferencias entre RDF y XTM y la forma básica de combinar e intercambiar informa-
El profesional de la información, v. 14, n. 2, marzo-abril 2005
ción entre ambos formatos, todo ello ilustrado con ejemplos seleccionados. Para los puristas del Dublin Core incluye un ejemplo especialmente dedicado (pp. 321-325). A pesar del debate sobre la complejidad en el uso de RDF, lo cierto es que continúa siendo una referencia obligada para la descripción de recursos de información digital y es muy abundante la bibliografía sobre la cuestión en los últimos años. Los capítulos restantes entroncan con aspectos de aplicación para la resolución de problemas como las redes semánticas (capítulo 13) y la representación de conocimiento (capítulo 14). Lectura detenida merece el capítulo 15, dedicado a los Topic Maps en la organización del conocimiento, escrito por A. Sigel. Detalla los fundamentos de la organización del conocimiento y la relaciona con los diferentes tipos de clasificaciones para proponer ejemplos y ámbitos de utilización de los Topic Maps. Al igual que el capítulo 7, incluye una completa bibliografía sobre esta cuestión (pp. 457-476). Por último, el volumen se cierra con dos capítulos que relacionan e integran a los Topic Maps con el ámbito de los sistemas educativos. En cualquier caso, los objetivos básicos de la obra quedan bien cubiertos y sin duda, a pesar de la escasa bibliografía al respecto, es bastante recomendable para obtener una panorámica general. En un ámbito tan dinámico como este, los dos años transcurridos tras su publicación han pasado factura a varios de los capítulos. Del bloque dedicado a los fundamentos de organización y razonamiento se deduce que la adopción de este paradigma engloba una cantidad de conceptos, estándares y lenguajes de etiquetado y de programación tan diversos, que, junto al trabajo previo de tratamiento de la información, implica un riguroso trabajo de planificación y de integración
LO MÁS NUEVO EN BUSQUEDAS BASADAS EN INTERNET… CSA Illumina, la nueva plataforma de búsqueda de CSA basada en Internet cuenta con una Interfaz de usario completamente nueva, funciones de búsqueda mejoradas y muchas otras ventajas para los usarios. • Navegacion más ergonomica y más fácil • Herramientas de búsqueda mejoradas • Nuevo A&I recursos electronicos a texto completo
que pasa bastante desapercibido a lo largo de la lectura de la monografía. Esta carencia hace que la obra pierda un poco de encanto, a pesar de estar muy bien documentada en la mayoría de los aspectos que cubre el texto. La implementación de los Topic Maps es un proceso que engloba diferentes y difíciles procesos. La ontología de un Topic Map debe estar muy bien diseñada para asegurar que el resultado refleje el sistema de información real que se representa. No debe olvidarse que las ontologías deben desempeñar un papel fundamental según el modelo teórico del web semántico –véanse los trabajos recogidos en Davies, J.; Fensel, D.; Van Harmelen, F. (eds.) Towards the semantic web. John Wiley & Sons, 2003–. Muestras de ello se ofrecen en los últimos capítulos del volumen al que va enfocada esta reseña. Pero tam-
• Cumple con ADA y SENDA • Eliminación de marcos • Nuevas opciones predeterminadas personalizadas
bién se deduce del análisis del bloque técnico que hay tres áreas que restringen el desarrollo de este tipo de aplicaciones: las herramientas de autor disponibles, la escalabilidad de las interfaces y la interoperabilidad. En todo momento se presentan capturas gráficas del software que se puede utilizar, pero nunca se entra a tratar temas tan importantes como el proceso de instalación del mismo y el grado de sencillez o complejidad de las aplicaciones. Esta carencia es uno de los problemas que lastran el impulso de las plataformas libres de desarrollo de aplicaciones, y es endémico en gran número de ellas. Lo que sí queda claro es que las herramientas tradicionales usadas para navegar por el material impreso tales como índices, referencias cruzadas, glosarios, catálogos, etc. no resultan ser, en su formulación actual, lo suficientemen-
Para evaluar la experiencia de CSA Illumina comuníquese con
[email protected]
te potentes como para satisfacer los requisitos del mundo de la información digital. El modelo presentado en esta obra puede ayudar de forma inteligente a estructurar la inagotable fuente de información no estructurada que es la world wide web. No en vano, Steve Pepper apuntó una vez: “If a book without an index is like a country without a map, then perhaps one day a world without Topic Maps will seem like a head without a brain”. Reseña realizada para Epi por: Piedad Garrido Picazo, Depto. Informática e Ingeniería de Sistemas y Jesús Tramullas, Depto. Ciencias de la Documentación, de la Universidad de Zaragoza. Ambos autores pertenecen a la Red temática de investigación en documentación digital. Grupo GRIO. Universidad de Zaragoza.
[email protected] [email protected]
El profesional de la información, v. 14, n. 2, marzo-abril 2005
159
Febrero-marzo 2005 ISSN 1386-6710 Vol. 14, nº2
Número dedicado a Posicionamiento web
Los precios para el año 2005 son los mismos de 2004.
(Los suscriptores individuales no han de escribir ningún nombre de institución, sólo indicar la dirección particular)
Departamento:
Suscripción anual Institucional: 129 euros + 4% IVA Individual: 75 euros + 4% IVA Número suelto: 22 euros
NIF institucional:
Dirección: Código postal: Teléfono:
Ciudad:
País:
Fax:
Correo-e:
Método de pago:
Enviar el boletín
Tarjeta de crédito: VISA Titular de la tarjeta:
Master Card
relleno, por correo
American Express
postal o electrónico, a: Apartado 32.280
Número de tarjeta:
08080 Barcelona
Caducidad (mm/aaaa):
España
Cheque nominativo en euros a nombre de El profesional de la información
suscripciones@
Transferencia bancaria a la cuenta de La Caixa 2100 0818 93 0200745544 Enviar, fotocopiado o escaneado, el resguardo de la transferencia. Las transferencias desde fuera de España deben hacerse a: IBAN ES95 2100 0818 9302 0074 5544 BIC/Código Swift CAIXESBBXXX
elprofesionaldelainfor macion.com Teléfono de atención al suscriptor:
Giro postal al apartado de correos 32.280 de Barcelona
+34 609 352 954
Enviar, fotocopiado o escaneado, el resguardo del giro.
Domiciliación en cuenta bancaria Entidad: Titular de la cuenta:
Oficina:
DC:
A los pagos realizados desde países distintos de España se les aplicará el IVA o VAT local. A todas las suscripciones de fuera de Europa se les aplicará un recargo de 60 euros en concepto de correo aéreo.
El profesional de la información, 2005, v. 14, n. 2, pp. 81-160
BOLETÍN DE SUSCRIPCIÓN Deseo recibir todos los números de la revista EPI a partir del mes de enero del año Suscripción: Institucional Personal Nombre: Institución:
La suscripción a la revista se realiza por años naturales completos, es decir, desde el mes de enero del año que usted desee que comience su nueva suscripción.
Núm:
Posicionamiento web: conceptos y herramientas
Boletín para comenzar o renovar online la suscripción: http://www.elprofesionaldelainformacion.com/suscripciones.html
Por Lluís Codina y Mari Carmen Marcos
Interacción entre medidas de popularidad en el posicionamiento web Todos los profesionales que lo deseen pueden remitir a la redacción de la revista El profesional de la información sus colaboraciones en forma de: - Notas breves - Trabajos más amplios sobre temas de fondo para la sección “Artículos”. El texto ha de enviarse en formato electrónico. Aparte, los materiales gráficos, en papel o ficheros gif, jpeg o tiff con unos anchos de entre 12 y 5,7 cm. y una resolución de 300 ppp. El tamaño ideal de un estudio para la sección “Artículos” es de 4.000 palabras. En casos excepcionales pueden publicarse artículos de mayor extensión. Los trabajos de esta sección son aprobados según el sistema tradicional “peer review”: al menos dos expertos en el tema, del Consejo Asesor de la revista y/o externos, deben dar el visto bueno antes de su publicación. Los textos deben enviarse sin formatos especiales (títulos, secciones, subsecciones, pies de página, sangrías, tabulaciones, colores, etc.). Los trabajos para la sección “Artículos” deben incluír: a) título en castellano, b) resumen en castellano de 100-150 palabras, c) 5-10 palabras clave en castellano, d) título en inglés, e) resumen en inglés de 100-150 palabras, f) 5-10 palabras clave en inglés, g) texto completo en castellano y h) nombre de los autores, lugar de trabajo y dirección de correo electrónico. Han de ser inéditos. Se valorará especialmente que los trabajos sean concisos y precisos. Se ruega a los autores que eviten una excesiva retórica. Las citas bibliográficas en el texto se realizarán de la forma: (Apellido, año). Las referencias bibliográficas, que se limitarán a las obras citadas en el texto, han de prepararse de acuerdo con
el siguiente esquema: Artículos de una publicación periódica: Apellido, Nombre; Apellido2, Nombre2. “Título del artículo”. En: Título de la publicación periódica, año, mes, v. [volumen], n. [número del ejemplar], pp. [págs. comienzo-final]. Ponencia presentada en un congreso: Apellido, Nombre; Apellido2, Nombre2. “Título de ponencia”. En: nombre del congreso, año, pp. [págs. comienzo-final]. Capítulo de una monografía: Apellido, Nombre; Apellido2, Nombre2. Título del capítulo. En: Apellido, Nombre; Apellido2, Nombre2. Título de la monografía. Lugar de publicación: editor, fecha. ISBN [número]. Monografías: Apellido, Nombre; Apellido2, Nombre2. Título del trabajo. Lugar de publicación: Editor, fecha. ISBN [número] Recurso en línea: Apellido, Nombre; Apellido2, Nombre2. Título del recurso. Consultado en: día-mes-año. dirección Las contribuciones se pueden enviar a la redacción de la revista o a cualquiera de los miembros del consejo de redacción. El hecho de que un trabajo sea publicado en EPI no implica que la redacción se adhiera a las opiniones expresadas en él.
Redacción EPI: Apartado 32.280 08080 Barcelona.
[email protected] La redacción se reserva el derecho de adaptar los textos al estilo gramatical y literario de la revista.
Por Valentín Moreno Pelayo
Posicionamiento en buscadores: optimización de sitios web Por Iñigo Arbildi Larreina
Documentación técnica en la industria GILT Por Lidia Cámara de la Fuente
9as Jornadas Españolas de Documentación Fesabid 2005 Usabilidad en sistemas de información: los expertos responden Por Mari Carmen Marcos y Carles Gibernau