Publication:
Características textuales como medida cualitativa de la Información en la generación semiautomática de tesauros

Loading...
Thumbnail Image
Identifiers
Publication date
1998-09-01
Defense date
Advisors
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Sociedad española para el procesamiento del lenguaje natural
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
El objetivo del GTI es la generación semiautomática de tesauros mediante el análisis de un corpus. Tras ensayar distintos métodos de clasificación de la información, desde co-ocurrencia de términos a redes neuronales, se mostró necesaria la creación de nuevos indicadores que aportasen información adicional a la ya suministrada por el tesauro. La presentación de estos indicadores, y su previsible potencial, es la meta de la presente comunicación. El objetivo es reaprovechar el gran volumen de datos necesarios para realizar la clasificación y emplearlos en dos campos distintos: por un lado la validación del tesauro y por otro la creación de indicadores que nos indiquen a-priori la creatividad del texto dentro de nuestro corpus. La estructuración y etiquetado previo del texto parecen en estas circunstancias un paso necesario para poder estudiar posteriormente el resultado del conjunto de parámetros medidos en el set de documentos. La novedad se estudia desde un enfoque multidimensional: análisis lingüístico y del formato de los textos, estudio del tesauro generado, y la creación de indicadores ad-hoc. Al tiempo, se miden distintos parámetros en el tesauro para validar el tesauro autogenerado. Para el análisis matemático de los datos, se usan análisis multivariante y de las componentes principales. Una evaluación del programa está actualmente en curso.
Description
Keywords
Bibliographic citation
Juan Bautista Llorens Morillo, Jorge Morato Lara, José Antonio Moreiro González, Manuel Velasco. Características textuales como medida cualitativa de la información en la generación semiautomática de tesauros. Procesamiento del lenguaje natural, 1998, Nº. 23, pp. 61-68