Publication: Buscador de documentos con imágenes de texto manuscrito mediante Machine Learning
Loading...
Identifiers
Publication date
2019-06-16
Defense date
2019-07-02
Authors
Advisors
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
En un mundo cada vez más digitalizado, son cada vez más los organis-
mos que hacen públicos a través de Internet sus documentos manuscritos.
Libros, apuntes, diarios, registros de natalidad. Existe una gran variedad
de estos documentos accesible al público en general. Muchas de las herra-
mientas que gestionan estos documentos permiten búsquedas por título, au-
tor, fecha. . . Sin embargo, existen pocas herramientas de búsqueda de texto
dentro de estos documentos, por la complejidad y tediosidad de transcribir
dichos textos, que normalmente se encuentran en forma de imágenes. Una
herramienta que provea de esta capacidad tiene potencial de ser útil en di-
ferentes ámbitos. Evitaría tener que hojear una a una las páginas de estos
documentos hasta encontrar el contenido deseado. Por esta razón, en este
proyecto se ha desarrollado una herramienta que permite tanto la gestión de
estos documentos, como la búsqueda por texto en los mismos.
En particular, este trabajo detalla el estudio realizado sobre tecnologías
existentes que sirven para acometer el problema descrito. Además, desde un
punto de vista de ingeniería de software en este trabajo se detalla el diseño
del sistema, implentación de los diferentes aspectos necesarios, y validación
de la herramienta. También se han estudiado diferentes técnicas de Machine
Learning que permiten traducir las imágenes que componen estos documen-
tos a texto, y se han incorporado dichas técnicas a la herramienta propuesta.
Por último, desde un punto de vista más académico, se provee de un estudio
del transfondo individual de las tecnologías usadas.
Description
Keywords
Machine Learning, Diseño de interface, Diseño de interacción, Python, Javascript, Django