Publication:
Similitud y confusión fonéticas: reconocimiento humano vs. reconocimiento automático mediante técnicas entrópicas y de análisis de conceptos formales

Loading...
Thumbnail Image
Identifiers
Publication date
2014-07
Defense date
2014-07-23
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
En el presente proyecto se analiza y compara el comportamiento en reconocimiento del habla de una persona frente a un reconocedor automático del habla híbrido. El objetivo de nuestro estudio es el de analizar las características acústico-articulatorias que marcan los factores de reconocimiento humano, de esta manera seremos capaces de mejorar los reconocedores de habla automática. Dicho estudio se ha llevado a cabo haciendo uso de herramientas novedosas para el análisis de los errores de un reconocedor. Estas herramientas son los triángulos entrópicos, con los que medimos la calidad de un reconocedor con otras figuras de mérito que el valor de la precisión, y el análisis formal de conceptos que nos permitirá representar, para su posterior análisis, las confusiones de las bases de datos usadas mediante retículos de confusión. Gracias a estas herramientas tendremos una visión más clara de las diferencias en la percepción de las características acústico-articulatorias entre el reconocedor de habla humano y el automático. De este modo podremos sugerir nuevas líneas de investigación para mejorar dichas características en los reconocedores.
In this project we analyze and compare the performance in speech recognition of a person facing a hybrid automatic speech recognizer. The aim of our study is to analyze the acoustic-articulatory factors that marks the human recognition, so we will be able to improve automatic speech recognizers’ features. This study was carried out by using new tools for analyzing errors in automatic speech recognizers. These tools are entropic triangles, with which we measure the quality of a recognizer with other figures of merit that the value of accuracy, and formal analysis of concepts that allow us to represent, for further analysis, confusions bases data used by lattices of confusion. With these tools we will have a clearer view of the differences in the perception of acoustic-articulatory features between human and automatic speech recognizer. Thus we can suggest new lines of research to improve these characteristics recognizers.
Description
Keywords
Reconocimiento de voz, Proceso de señales, Características acústico-articulatorias, Triángulos entrópicos, Rretículos de confusión, Reconocedor automático del habla
Bibliographic citation