Publication:
Sistema de indexación y búsqueda de documentos audiovisuales

Loading...
Thumbnail Image
Identifiers
Publication date
2009-07
Defense date
2009-07-17
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
Los últimos avances en almacenamiento de datos y comunicaciones han producido un aumento de las bibliotecas digitales disponibles en Internet. Estas bibliotecas contienen además de información textual, todo tipo de información multimedia como por ejemplo imágenes, audio, vídeo... La organización y recuperación de información en estas bibliotecas resulta una tarea compleja. Por esta razón la recuperación de información multimedia es clave para el futuro de Internet. Los sistemas de recuperación de información basados en texto se han desarrollado con gran éxito en las últimas décadas. Sin embargo, los sistemas basados en contenido (aquellos que utilizan información intrínseca a cada recurso) han resultado ser demasiado complejos, especialmente cuando se manejan documentos de gran tamaño o grandes cantidades de datos. Además, la perspectiva tradicional de indexación mediante el uso de metadatos requiere el uso de procesos de etiquetado no automático. Por lo tanto es esencial un nuevo enfoque para realizar la indexación de documentos multimedia de manera simple y automática. El objetivo de este proyecto es diseñar una solución potente para la recuperación de documentos multimedia. El proyecto se centra en la recuperación de documentos de audio y vídeo y hace uso de las ventajas ofrecidas por los motores de recuperación basados en texto y los sistemas de reconocimiento automático del habla. Con el fin de indexar los documentos audiovisuales la herramienta obtiene la transcripción del audio y la procesa extrayendo la información necesaria, de esta manera las búsquedas se podrán realizar de manera sencilla mediante el uso de consultas en lenguaje natural. ____________________________________________
Latter advances in data storage and Communications have led to an increasing number of digital libraries, which are available on the internet. These libraries include not only textual information but also multimedia resources as images and audio or video files. Information organization and retrieval to handle this overwhelming volume of complex data; becomes a very hard task. Thus, the field of multimedia information retrieval is becoming crucial for me future of Internet. Text-based information retrieval systems have been developed successfully for decades. However, content-based information retrieval systems, i.e., those using the intrinsic information existing in each resource (images, audio, video), happen to be quite complex when considering big multimedia files or huge amounts of data. Besides, metadata indexing requires an important non-automatic labelling process. Hence, it is essential a new approach to index multimedia data simply and automatically. The aim of the project is designing a powerful solution for extracting and querying audio documents. The project has focused on audio information retrieval; andc a new solution, that takes advantage of speech recognition systems and text search engines, has been designed. Audio transcription is obtained automatically and then it is processed to obtain the required information for me indexing. Besides the search will be easily fulfil in common language.
Description
Keywords
Bibliotecas digitales, Multimedia, Recuperación de la información, Documentación audiovisual
Bibliographic citation