Para poder aplicar algunas de las reglas gramaticales que contamos en el texto,surgió la necesidad de tener con un diccionario que nos permitiese conocer las posibles categorías de las palabras. Así, se consiguió, a través de la red un diccionario y a partir de él se construyó el que actualmente se maneja. Primero, se obtuvo la información que nos hacía falta : el nº de sílabas y la categoría asociada; después de obtener esta información para todas las palabras del diccionario, el diccionario se ha completado formando los plurales de los nombres, las terceras personas, los pasados y los participios de los verbos, además del grado comparativo y el grado superlativo de los adjetivos.
Al final partiendo del un diccionario de unos 40.000 términos, hemos formado un diccionario de categorías de más de 87.000 términos, con posibilidad de ir ampliando con nuevas adquisiciones de vocabulario.
29
Capítulo VI : El Diccionario
6.1 Formato del diccionario.
Partiendo de un diccionario
con un formato donde aparece la
palabra seguida de su categoría y su significado, a veces aparece también la transcripción fonética de la palabra, otras veces aparecen diferentes terminaciones que añadidas a la palabra anterior dan lugar a un término derivado. Es un formato lleno de excepciones, pero a partir de él se extrajo la información que interesaba.
A continuación se da un ejemplo de página del diccionario original :
30
Capítulo VI : El Diccionario
@1 a \'a_-\ n, often cap : the 1st letter of the English alphabet
2 a \*, (')a_-\ indefinite article : ONE, SOME -- used to indicate an unspecified or unidentified individual