LA CATALOGACIÓN ELECTRÓNICA EN ESPAÑOL: MÉTODO Y HERRAMIENTA DE DESARROLLO. Víctor M. Castel

LA CATALOGACIÓN ELECTRÓNICA EN ESPAÑOL: MÉTODO Y HERRAMIENTA DE DESARROLLO Víctor M. Castel Instituto de Ciencias Humanas, Sociales y Ambientales, CON

4 downloads 77 Views 833KB Size

Recommend Stories


Herramienta y Maquinaria. Herramienta
Procedimientos Constructivos Unidad 7: Maquinaria Herramienta y Maquinaria Herramienta Objeto o instrumento que se utiliza para trabajar en diferent

LA UTILIZACIÓN DE SIMULADORES COMO HERRAMIENTA DE DESARROLLO DE COMPETENCIAS
X Jornadas Internacionales de Innovación Universitaria Educar para transformar LA UTILIZACIÓN DE SIMULADORES COMO HERRAMIENTA DE DESARROLLO DE COMPET

Proyecto Jara: Herramienta de Desarrollo para la enfermería extremeña
Proyecto Jara: Herramienta de Desarrollo para la enfermería extremeña. Mercedes Fraile Bravo Coordinadora de Enfermería del Proyecto Jara Subdirección

JUAN PABLO CASTEL, ENTRE LA NEUROSIS Y EL CRIMEN
JUAN PABLO CASTEL, ENTRE LA NEUROSIS Y EL CRIMEN Acontece que el amor se concilla con el odio más violento al ser amado cuando un amante, a pesar de t

Story Transcript

LA CATALOGACIÓN ELECTRÓNICA EN ESPAÑOL: MÉTODO Y HERRAMIENTA DE DESARROLLO Víctor M. Castel Instituto de Ciencias Humanas, Sociales y Ambientales, CONICET y Facultad de Filosofía y Letras de la Universidad Nacional de Cuyo Mendoza, Argentina [email protected]

En G. Ciapuscio, K. Jungbluth y D. Kaiser, Eds. (2005) Neue Romania 250: 233-247, Número especial: Linguistik am Text. Beiträge aus Argentinien und Deutschland/Lingüística en el texto. Berlin: Institut für Romanische Philologie der Freien Universität Berlin. ISSN 0177-7750.

234

Víctor M. Castel

1. Introducción* Un catálogo es esencialmente un texto que describe bienes y/o servicios con la finalidad de facilitar operaciones de compra-venta. En el comercio electrónico entre empresas, el catálogo es implantado en una plataforma transaccional de modo que pueda ser interrogado con respecto a su contenido mediante búsquedas exploratorias y paramétricas. Para que estos recursos de búsqueda sean efectivos, es imprescindible que el texto sea apropiado y representativo de los usos y costumbres de proveedores, fabricantes y distribuidores de un dominio dado, esté normalizado de acuerdo con pautas que fijan los administradores del mercado electrónico en consenso con sus clientes, y esté acompañado de una taxonomía de los bienes y/o servicios descriptos cuyas categorías se definan mediante pares de atributos y valores.

El propósito de este trabajo es mostrar el método y la herramienta que diseñamos para satisfacer las condiciones precedentes en el ámbito de una empresa de catalogación electrónica. Nos referiremos entonces a un problema esencialmente práctico cuya solución presupone relacionar aspectos teóricodescriptivos con aspectos aplicados.

En el plano teórico-descriptivo, el objetivo central a alcanzar es la descripción del catálogo en tanto texto. Tomado en toda su complejidad, el catálogo refleja, como cualquier otro tipo de texto, correlaciones sistemáticas entre propiedades contextuales

y propiedades

lingüísticas.

En este sentido, nos resultó

particularmente apta la perspectiva de la Lingüística Sistémica Funcional (en adelante, LSF) debido al énfasis que esta escuela pone en modelizar las

correlaciones entre ‘campo’, ‘tenor’ y ‘modo’ a nivel contextual, por un lado, y *

El trabajo, que es una versión ligeramente modificada de la ponencia “Escritura asistida de

catálogos electrónicos” leída en el Simposio sobre Lectura y Escritura de la Cátedra UNESCO en Mendoza en abril de 2002, recoge aspectos de la investigación que llevé a cabo durante una estadía de investigación en el Departamento de Ontología y Lingüística de Katalyx Cataloguing España entre agosto y setiembre de 2001. Agradezco al director y personal de Katalyx Cataloguing España haberme permitido utilizar sin restricción alguna todos los recursos tecnológicos existentes en la empresa sin los cuales no podría haber concretado los objetivos de la investigación.

La catalogación electrónica en español

semántica y sintaxis ‘experiencial’, ‘interpersonal’ y ‘textual’ a nivel lingüístico, por el otro.1 Se trata entonces de construir una gramática que defina la clase de textos posibles que son compatibles con un tipo de catálogo.

En el plano aplicado, los objetivos prioritarios son proveer a los documentalisas de la empresa de catalogación electrónica, por un lado, de un método lingüístico que los guíe en la construcción de la gramática del catálogo, y, por el otro, de una herramienta informática que los asista en la escritura de catálogos apropiados.2 2. El método El insumo fundamental para el desarrollo de un catálogo lo constituye lo que en ámbitos empresariales se conoce como la cadena de valor de la industria o sector a catalogar. Una cadena de valor representa “el conjunto de agentes y

actividades ([insumos,] talleres, trabajos, etc.) involucrados a lo largo del proceso productivo, desde los proveedores de las diferentes materias primas hasta las operaciones de distribución del producto final” (González 2001: 1). La Figura 1 ilustra la cadena de valor de la industria del calzado según conceptualización de Euroinfomarket para la Comunidad Valenciana, España.3

En términos de la LSF, una cadena de valor captaría variadas propiedades del contexto, particularmente las de campo, que caracterizan las relaciones entre proveedores de materias primas, fabricantes de productos que requieren de esas materias primas y distribuidores de los productos fabricados. En términos de la Lingüística Computacional (en adelante, LC), el campo específico de una 1

En realidad, este objetivo se alcanza con cualquier modelo lingüístico que se ocupe de expresar generalizaciones sobre la proyección de propiedades del contexto en propiedades el lenguaje. Optar por la LSF es simplemente una decisión basada en las preferencias y prácticas actuales del autor. 2

Nótese que hablamos de asistencia en la escritura y no de generación (automática) de catálogos. Un objetivo a largo plazo sería lograr el máximo de automatización en la generación de catálogos. El objetivo de la investigación de la que damos cuenta aquí, mucho más modesto por cierto, fue simplemente asistir computacionalmente en aspectos retóricos y lingüísticos de la escritura de catálogos. 3

Esta conceptualización de la cadena de valor de la industria del calzado fue realizada por Emilio González de Euroinfomarket con el asesoramiento del Instituto Tecnológico del Calzado y Conexas de España. Extraemos la Figura 1, sin modificación alguna, de González 2001: 7.

235

236

Víctor M. Castel

industria es el dominio a modelizar formalmente en sus aspectos cognitivos y lingüísticos, que luego es implementable en sistemas de procesamiento automático, ya sean de generación o de análisis de textos.

Supongamos que el cliente A, una empresa administradora de un mercado electrónico, requiere a la empresa B, una empresa de catalogación, un catálogo de la industria X para poner en relación a fabricantes de X con proveedores de materias primas y servicios para la fabricación de X, con la finalidad de gestionar las transacciones comerciales entre los fabricantes y sus proveedores.

Los objetivos a alcanzar por parte de B para satisfacer la demanda de A son: (a) desarrollar una taxonomía de bienes y servicios directos de la industria X;4

(b) definir el conjunto de propiedades generales y específicas de las categorías que compongan la taxonomía;

(c) definir las estructuras genéricas de los textos que describen las categorías terminales de la taxonomía;

(d) definir las reglas de realización léxico-gramatical de las estructuras genéricas resultantes de (c); y

(e) generar el catálogo a implantar en la plataforma de comercio electrónico de A.

B puede alcanzar estos objetivos mediante la ejecución de las fases que se explicitan en §§2.1-2.4. Por bienes y servicios “directos” se entiende las materias primas y servicios que intervienen directamente en la fabricación de X (por ejemplo, suelas, tacones, adhesivos, etc. en la industria del calzado); contrastan con los bienes y servicios “indirectos” (también conocidos como “Maintenance, Repairs and Operations”), que son los que intervienen sólo de manera indirecta en la fabricación de X y son utilizados en diversos ámbitos industriales, tales como mobiliario y maquinaria de oficina, etc. En el comercio electrónico, se suele distinguir entre mercados verticales, en los que se transaccionan bienes y servicios directos, y mercados horizontales, en los que se transaccionan bienes y servicios indirectos. 4

La catalogación electrónica en español

2.1. Conformación de un corpus para la identificación y clasificación de los bienes y servicios de la cadena de valor de la industria X

Para desarrollar la taxonomía de bienes y servicios de la industria X, es necesario acceder a las fuentes que aporten información sobre la fabricación de X (componentes, accesorios y maquinaria). De estas fuentes, que pueden estar en formato papel y/o electrónico o incluso sólo en la mente de expertos,5 se extraerán los datos para la identificación y clasificación de los bienes y servicios involucrados en la fabricación de X.6 Este relevamiento de información se completa mediante entrevistas a fabricantes de X y proveedores de materias primas necesarias para la fabricación de X.

Puesto que el objetivo del relevamiento es identificar y clasificar los bienes y servicios de la industria X, el propósito principal de las entrevistas es construir un corpus de los artículos y servicios requeridos para la fabricación de X, y de las descripciones de esos artículos. El corpus se utiliza para inducir:

(a) las categorías a que pertenecen esos artículos, esto es, las categorías terminales de la taxonomía;

(b) las categorías que pueden agrupar a esos artículos en una taxonomía, esto es, las categorías no terminales;

(c) las propiedades generales y distintivas de esas categorías terminales y no terminales; y

(d) las estructuras genéricas y las reglas de realización léxico-gramatical que darán cuenta de los textos que compondrán el catálogo propiamente dicho.

5

Por experto entendemos una persona que conoce en profundidad la industria X por lo que concierne a los insumos involucrados en la fabricación de X, incluyendo las características distintivas de cada insumo. Del lado del fabricante, es generalmente la persona a cargo del departamento de compras de la fábrica. 6

En lo que sigue supondremos que el objetivo es dar cuenta solamente de la relación entre el proveedor de insumos para la fabricación de X y el fabricante de X.

237

238

Víctor M. Castel

Véase en la Figura 3 un fragmento de taxonomía de bienes y servicios que da cuenta de la relación proveedores-fabricantes de calzado. 2.2. Definición de la organización conceptual de los bienes y servicios de la industria X

Las observaciones sobre el corpus obtenido en la fase §2.1, siempre en

interacción estrecha con los expertos, nos asisten en la tarea de definir:

(a) una taxonomía de las categorías de bienes y servicios,

(b) las categorías terminales y no terminales que componen la taxonomía,

(c) estas categorías mediante pares de atributos y valores,

(d) los atributos y sus alcances, y

(e) los valores de esos atributos. 2.3. Especificación de las estructuras genéricas y las reglas de realización léxico-gramatical de las descripciones de artículos de la industria X

Sobre la base de las observaciones del corpus de la fase §2.1 y las

definiciones construidas en la fase §2.2, también en interacción con los expertos, se procede a especificar formalmente:

(a) las estructuras genéricas asociadas a las categorías terminales de la taxonomía,

(b) las reglas de realización léxico-gramatical que permiten generar, a partir de esas estructuras genéricas, los textos que describen los artículos que pertenecen a las categorías terminales. En esta fase, es conveniente incluir también ejemplos que ilustren descripciones de artículos generables mediante (b) a partir de (a).

La catalogación electrónica en español

239

240

Víctor M. Castel

2.4. Validación del catálogo de la industria X Puesto que el catálogo debe permitir transaccionar de manera eficiente a un conjunto más o menos grande de proveedores y fabricantes, es imprescindible que el mismo no solamente sea representativo de la industria sino que además esté normalizado de alguna manera. Es necesario entonces que exista un proceso de validación del catálogo por parte de los proveedores y fabricantes para verificar su representatividad y así la adecuación del proceso de normalización. 3. La herramienta

La empresa B puede ejecutar las fases descriptas en §§2.1-2.4 con la

asistencia informática de una herramienta de desarrollo de catálogos que permita visualizar y manipular una masa considerable de información relativa a:

(a) categorías y relaciones entre categorías;

(b) atributos y valores de atributos de esas categorías;

(c) definiciones de categorías, atributos y valores;

(d) definiciones de estructuras genéricas, esto es, de la clase de organizaciones retóricas posibles asociadas a categorías terminales;

(e) reglas de realización léxico-gramatical de esas estructuras genéricas, esto es, cómo se expresan mediante textos las estructuras genéricas;

(f) ejemplos de descripciones de productos y servicios, es decir, los textos propiamente dichos; y (g) generación en formato XML del árbol de categorías y atributos de acuerdo con la DTD definida para alimentar el módulo de producción del catálogo.7 Las

7

DTD es la abreviatura de Document Type Definition. Una DTD define una clase de documentos bien formados de acuerdo con el lenguaje de marcado XML.

La catalogación electrónica en español

Figuras 2 y 3 ilustran pantallas de la Herramienta de Desarrollo de Taxonomías y Esquemas (en adelante, HDTE) utilizada por la empresa Katalyx Cataloguing de España para la ejecución de las fases referidas en §§2.1-2.4.8 Una herramienta de catalogación puede concebirse entonces como un entorno de escritura en el que distinguimos dos tipos de textos:

(1) textos requeridos por la herramienta, y

(2) textos requeridos por el catálogo.

Los textos de tipo (1) son necesarios para explicitar aspectos de forma y contenido subyacentes en el catálogo y así facilitar la tarea de construcción del catálogo propiamente dicho (ver en las Figuras 2 y 3 los cuadros de texto siguientes: “Taxonomía”, “Definición de …”, “Atributos de …”, “Definición de …”, “Valores posibles de …”, “Definición de valores”, y “Ejemplos de valor”).

Los textos de tipo (2) constituyen el catálogo en tanto producto resultante de la tarea de desarrollo asistido por la herramienta (ver en las Figuras 2 y 3 los cuadros de texto “Estructura retórica (o estructura genérica) de …”, “Expresión/Estilo (o reglas de realización) de …” y “Ejemplo de descripción de …”).

La Figura 3 ilustra la situación de la industria del calzado en la relación Proveedor (de materias primas)-Fabricante. La Figura 2 ilustra la situación de un catálogo de servicios indirectos para empresas.

Si bien es factible diseñar e implementar funcionalidades para la generación (semi)automática de ambos tipos de texto, en la práctica y desde las urgencias puntuales de las empresas de catalogación, se lo hace para los textos de tipo (2), es decir, para la generación de las descripciones (cortas y largas) de bienes

8

HDTE es un entorno de desarrollo de catálogos implementado en Visual Basic 6.0.

241

242

Víctor M. Castel

y servicios asignables a las categorías terminales de la taxonomía.9 A continuación, ilustramos cómo asiste HDTE en la escritura de esas descripciones. En §3.1, mostramos la asistencia en la escritura de descripciones

largas de un servicio indirecto (véase la Figura 2); en §3.2, lo hacemos para un artículo de la industria del calzado (véase la Figura 3). 3.1. Asistencia en la generación de descripciones largas de un servicio10 Sendero de la categoría terminal “Lavado completo de vehículos”: Servicios/Limpieza/Lavado de vehículos/Lavado completo de vehículos Estructura genérica de “Lavado completo de vehículos”: SERVICIO BÁSICO + (SERV. INCLUIDOS) + (SERV. ECOLÓGICOS) + (SERV. COMPLEMENTARIOS) Reglas de realización léxico-gramatical de la estructura genérica precedente: SERVICIO BÁSICO: se puede expresar mediante el nombre de la categoría o se puede reemplazar "vehículos" en el nombre de la categoría por una lista de sustantivos que designen tipos de vehículos. Esta lista se puede cerrar mediante la expresión "y todo tipo de vehículos" y "y otros tipos de vehículos". Si el lavado que se ofrece es lavado automático o lavado manual, entonces se puede especificar mediante un adjetivo pospuesto a "lavado". Cuando el lavado es manual, el adjetivo que se usa es generalmente "artesanal".

Una descripción corta es una descripción “telegráfica” como la del ejemplo en la Figura 3. Una descripción larga es una descripción completa del artículo que es parte de la categoría terminal de la taxonomía y que hasta hoy, en principio, los mercados electrónicos no pretenden normalizarla (véase la Figura 3); en cualquier caso, es este también un espacio potencial para la generación automática de textos. 9

10

Con ligeros cambios, utilizo la propuesta de Hlavacka et al. 2001, con permiso de Katalogs Cataloguing S.L.

La catalogación electrónica en español

ASPECTOS ECOLÓGICOS: con esta variable se hace referencia al tipo de productos y al tratamiento de las aguas residuales, acentuando la orientación ecológica del sistema. Se expresa de manera general, mediante la frase "sistema ecológico de lavado", o de manera más específica, mediante frases tales como "productos biodegradables", "productos ecológicos", "sistema de reciclaje de agua", algunas de las cuales se pueden combinar entre sí. Ejemplos de descripciones generadas por las reglas precedentes: Ejemplo 1: Lavado (automático) completo de vehículos. Lavado exterior, aspirado y lavado de alfombras y tapizado, y lavado del motor. Productos biodegradables/ecológicos y sistema de reciclaje del agua. Servicios adicionales de cambio de aceite, encerado y pulido.

Ejemplo 2: Lavado (automático) completo de autos, camionetas, furgonetas y todo tipo de vehículos.

Ejemplo 3: Lavado exterior del vehículo, aspirado y lavado de alfombras y tapizado, y lavado del motor. Servicios adicionales de cambio de aceite, encerado y pulido. 3.2. Asistencia en la generación de descripciones cortas de un producto11 Sendero de la categoría terminal “Tacones”: Industria auxiliar del calzado/Productos/Tacones Estructura genérica de “Tacones”: CATEGORÍA TERMINAL + (FORRO) + (COLOR) + (MODELO) + de + MATERIAL + (CARACT. A DESTACAR) Reglas de realización léxico-gramatical de la estructura genérica precedente:

11

Tomo el ejemplo, con cambos mínimos, de la taxonomía del vertical del calzado de Euroinfomarket, Valencia, España (Euroinfomarket 2002).

243

244

Víctor M. Castel

1. Los valores 'sí' y 'no' del atributo FORRO se realizan como 'forrado' y 'sin forrar' respectivamente. 2. Si el valor de FORRO = ‘sin forrar’, entonces puede no realizarse lingüísticamente. Ejemplos de descripciones generadas por las reglas precedentes: Ejemplo 1: Tacón de plástico. Ejemplo 2: Tacón rojo de madera. Ejemplo 3: Tacón forrado negro de plástico. 4. Conclusiones Este trabajo ha mostrado, sin pretensión de pulcritud teórica ni refinamiento descriptivo, una utilización posible de aspectos generales de metodología lingüística y aspectos particulares de la LSF y la LC en la solución del problema aplicado de construcción de catálogos en el ámbito de una empresa de catalogación electrónica. Sin duda, los recursos conceptuales y metodológicos de la LSF y la LC son hoy lo suficientemente poderosos como para permitir imaginar

soluciones

más

adecuadas

descriptivamente

y

eficientes

computacionalmente que la ofrecida en este trabajo. La LSF, en una versión formal aplicada a la generación de textos (Matthiessen et al. 1991; Fawcett et al. 1993), podría contribuir de manera significativa tanto en la definición de estructuras genéricas (Swales 1991; Hasan 1996), como en la definición de las reglas de realización léxico-gramatical de las mismas (Castel et al. 2000; Castel 2003). HDTE, que por ahora es sólo un embrión de herramienta para la asistencia en la escritura de catálogos electrónicos, evoluciona hacia un sistema de modelización de dominios cognitivos restringidos y de generación automática de descripciones de bienes y servicios en lengua española. Bibliografía

Castel, Víctor M. (2003, en prensa) “Generación de artículos de investigación científica en inglés: el abstract como una estructura de rasgos sistémicos funcionales”, en Signo & Seña.

La catalogación electrónica en español

245

Castel, Víctor M./Hlavacka, Laura/Rezzano, Susana/Car, Ester/ Diblasi, Angela 2000:

“Computer-aided

Writing

of

Research

Paper

Abstracts”,

comunicación leída en el XXVII International Systemic Functional Congress. University of Melbourne, Australia, julio de 2000. Euroinfomarket 2002: Catálogo de la industria auxiliar del calzado. Valencia. España. Fawcett, Robin/Tucker, Gordon/Lin, Yuen 1993: “How

systemic functional

grammar works: The role of realization in realization”, en Horacek, H./Zock, M. (eds.) 1993: New Concepts in Natural Language Generation. London. Pinter. Pp. 114-86. González, Emilio 2001: Cadena de valor de la industria del calzado. Valencia. Euroinfomarket. Halliday, Michael/Matthiessen, Christian 1999: Construing Experience thro-ugh Meaning. A Language-based Approach to Cognition. London. Continuum.

Hasan, Ruqaiya 1996: “The nursery tale as a genre”, en Cloran, Carmen/Butt, David/Williams, Geoffrey (eds.) 1996: Ways of Saying: Ways of Meaning. Selected Papers of Ruqaiya Hasan. London. Cassell. Pp. 51-72.

Hlavacka, Laura/Rossi, Daniel 2001: Estructuras retóricas y reglas de realización

léxico-gramatical de descripciones de servicios indirectos. Manuscrito inédito, Mendoza.

Matthiessen, Christian/Bateman, John 1991: Text Generation and Systemic Linguistics: Experiences form English and Japanese. London. Pinter.

Swales, John 1990: Genre Analysis: English in Academic and Research Settings. Cambridge. Cambridge University Press.

Figura 1: Cadena de valor de la industria del calzado

Figura 2: Herramienta de desarrollo de catálogos electrónicos. Ejemplo de servicios indirectos.

248

Víctor M. Castel

Figura 3: Herramienta de desarrollo de catálogos electrónicos. Ejemplo de la industria del calzado

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.