Publication:
Estudio de los errores de palabra producidos por el servicio de subtitulado automático de Apeinta

Loading...
Thumbnail Image
Identifiers
Publication date
2011
Defense date
2011-02-24
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Geographic coverage
España
Organizational Units
Journal Issue
Abstract
Dado que la tecnología pretende solucionar los problemas a los que nos enfrentamos, ésta debe ser la principal herramienta de investigación en el área de la educación. La educación es un derecho inalienable; sin embargo existen innumerables barreras que impiden el acceso a la educación a ciertos colectivos de la población. Uno de los colectivos más perjudicado es de las personas con discapacidad auditiva en edad escolar o universitaria, en pleno desarrollo intelectual. Según datos de la Encuesta sobre discapacidades realizada por el Instituto Nacional de Estadística (INE) en 2008, el número de personas con discapacidad auditiva es de 1.064.200, el 4% de la población española. Estos datos y la perspectiva de futuro obligan a promover un cambio del modelo educativo tal y como lo conocemos hoy en día. Para hacer frente a los problemas de accesibilidad en entornos educativos, el Centro Español de Subtitulado y Audiodescripción, a través del proyecto APEINTA, desarrolló un sistema de subtitulado automático, en directo y diferido, que utiliza la tecnología del Reconocimiento Automático del Habla (RAH) para transcribir la voz a texto, de modo que los alumnos con discapacidad auditiva pudieran seguir el curso de las clases sin dificultad. Tras varias evaluaciones de APEINTA se detectó que una de las principales cuestiones a las que se enfrenta el RAH son los errores cometidos por un incorrecto reconocimiento de la voz; estos errores, denominados en su término anglosajón Word Error Rate (WER), o ratio de error de palabra, repercuten en la comprensión de las transcripciones y en la pérdida de información para el alumno. La primera parte del proyecto que se desarrolla en este documento estudia la influencia del WER en el servicio de subtitulado en diferido de APEINTA, donde automáticamente se permite subtitular vídeos. Así mismo, también se estudia la influencia del reentrenamiento en los sistemas de reconocimiento de voz. Las transcripciones generadas por sistemas de subtitulado automático y que son utilizadas en el reentrenamiento, deben ser corregidas para aumentar la eficiencia del mismo. Sin embargo, la corrección de los errores de las transcripciones consume mucho tiempo y recursos, por lo que es un aspecto crítico en el proceso global. La segunda parte del proyecto se centra en encontrar soluciones que asistan en esta tarea y, para ello, se tratará de modificar el sistema reconocedor para obtener información adicional que apoye y facilite la corrección de las transcripciones. En último lugar se ha construido un prototipo de editor de textos que utiliza las nuevas funcionalidades incorporadas. _____________________________________________________________________________________________________________________
Because the technology is designed to solve the problems we face, this should be the main paradigm of research in the area of education. Education is an inalienable right; however there are numerous barriers that impede access to education to certain groups of population. Hearing impairment people at school or university are one of the groups most affected, due they are in the beginning or in the middle of their intellectual development. According to the Survey on Disability conducted by the National Statistics Institute (INE) in 2008, the number of people with hearing impairment is 1,064,200, 4% of the Spanish population. These data and the prospect of future force to promote a change of the educational model as we know it today. To face accessibility issues in educational enviroment, the Spanish Center for Subtitles and Audio Description (CESyA), developed a system for automatic subtitling, live and recorded, using the technology of Automatic Speech Recognition (RAH) to transcribe voice into text, named APEINTA project; so that hearing impaired students could follow the classes without difficulty. After several evaluations APEINTA detected that one of the main problems facing the RAH are the mistakes of an incorrect speech recognition. These errors called Word Error Rate (WER), impact on the understanding of the transcripts and could cause data loss for the student. The first part of a project developed in this paper examines the impact of WER in the subtitling deferred service of APEINTA, which allows subtitling videos automatically. Likewise, it also examines the impact of enrollment in voice recognition systems. The transcripts generated by automatic captioning systems that are used for enrollment, should be corrected to increase efficiency. However, the correction of the transcriptions is a time and resource consuming, so it is critical for the global process. The second part of the project focuses on finding solutions to assist in this task, so we will try to modify the recognition system to get additional information to assist transcript’s correction. Finally a text editor prototype that uses the new features was built.
Description
Keywords
Reconocimiento de voz, Detección de errores, Accesibilidad, Sistemas de subtitulado automático
Bibliographic citation