Detección automática de paráfrasis sobre un corpus de preguntas en inglés

e-Archivo Repository

Show simple item record

dc.contributor.advisor Cid Sueiro, Jesús
dc.contributor.author Renedo Muñoz de la Peña, Iñaki
dc.date.accessioned 2019-11-18T13:04:20Z
dc.date.available 2019-11-18T13:04:20Z
dc.date.issued 2018-06
dc.date.submitted 2018-07-09
dc.identifier.uri http://hdl.handle.net/10016/29184
dc.description.abstract El aumento exponencial de la información escrita durante los últimos años ha creado la necesidad de desarrollar herramientas con el objetivo de procesar de manera automática todo este conocimiento. Existen gran cantidad de aplicaciones y técnicas implementadas con el fin de procesar automáticamente la información escrita. Una de las ramas de investigación más popular a causa de su amplia aplicabilidad es la detección de paráfrasis. En el presente Trabajo de Fin de Grado, se presenta la solución a un problema de detección de paráfrasis en textos cortos. Concretamente, se trata de un problema de detección de preguntas repetidas sobre un corpus de pares de preguntas en inglés. Con el objetivo de solucionar un problema de estas características, se han combinado varias técnicas basadas en la similitud léxica y la semántica de las palabras. En el presente Trabajo de Fin de Grado, se revisa el estado de las investigaciones sobre la detección de paráfrasis y se describen las técnicas más destacadas. Las técnicas basadas en aprendizaje automático son las que presentan mejores prestaciones, sin embargo, el problema de detección de paráfrasis en textos cortos no ha sido resuelto aún con carácter definitivo.
dc.description.abstract The exponential increase in written information over the last few years has created the need to develop tools with the aim of automatically processing all this knowledge. There are many applications and techniques implemented in order to automatically process written information. One of the most popular research branches is paraphrase detection because the amount of uses that it has. In this final degree project, is presented a paraphrase detection problem in short texts. Specifically, it is a repeated questions detection problem on a corpus of pairs of questions in english. In order to solve a problem of these characteristics, several techniques based on lexical and semantic similarity of words have been combined. In addition, in this final degree project, the status of the researches in paraphrase detection is reviewed and the most outstanding techniques are described. The techniques based on machine learning are those that present better performance, however, the problem of paraphrase detection in short texts has not been solved definitely.
dc.language.iso spa
dc.rights Atribución-NoComercial-SinDerivadas 3.0 España
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subject.other Reconocimiento de texto
dc.subject.other Detección de paráfrasis
dc.subject.other Aprendizaje automático
dc.subject.other Textos cortos en inglés
dc.title Detección automática de paráfrasis sobre un corpus de preguntas en inglés
dc.type bachelorThesis
dc.subject.eciencia Telecomunicaciones
dc.rights.accessRights openAccess
dc.description.degree Ingeniería de Sistemas Audiovisuales
dc.contributor.departamento Universidad Carlos III de Madrid. Departamento de Teoría de la Señal y Comunicaciones
 Find Full text

Files in this item

*Click on file's image for preview. (Embargoed files's preview is not supported)


The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record