Publication:
Lecturabilidad de las imágenes en la web

Loading...
Thumbnail Image
Identifiers
Publication date
2021
Defense date
2021-09
Advisors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
La lecturabilidad de las imágenes en la web trata de analizar qué valor aportan las imágenes al texto que las acompaña, si este valor es alto las páginas web serán más comprensibles, por lo que los usuarios usarán más la web y la recomendarán a sus amigos. El presente proyecto surge por la comprobación tras análisis de que muchas páginas web no están bien diseñadas, ya que incluyen imágenes dentro de ellas que no aportan valor añadido, por lo que los portales resultan más difíciles de comprender. Esto supone un problema desde el ámbito de la accesibilidad ya que puede haber personas con discapacidades o personas mayores que no puedan disfrutar de una navegación satisfactoria por internet o que no puedan entender la información que se presenta, al estar las webs mal diseñadas. El proyecto comprende el diseño e implementación de una aplicación capaz de medir esta lecturabilidad de las imágenes en la web con la finalidad de localizar las deficiencias de diseño de las webs para que puedan ser corregidas y hacerlas más accesibles. El presente trabajo comprende la implementación de una aplicación de escritorio que usa el lenguaje de programación Python, mediante una interfaz gráfica sencilla e intuitiva para los usuarios. A través de esta interfaz se permitirá a los usuarios introducir la URL de la página sujeta de análisis, se podrán ver los resultados obtenidos de concordancia entre texto-imagen y además permitirá exportar la salida obtenida a un fichero en formato JSON. La página web introducida por el usuario se extraerá, y será descompuesta y limpiada de los distintos elementos HTML. Una vez descompuesta se determinará el tema sobre el que hablan los textos de la web gracias al algoritmo de procesamiento del lenguaje natural implementado. También se analizarán las imágenes gracias al algoritmo de reconocimiento óptico de caracteres, y una vez sacada toda esta información se calculará para las distintas duplas de elementos, tanto imagen-párrafo como imagen-titulo, la concordancia entre ellas. Esto se mostrará al usuario mediante una salida en formato JSON a través de la interfaz, y por último el usuario será capaz de exportar esta salida en formato JSON a su ordenador. La valoración final de la aplicación ha sido positiva, aunque se ha comprobado a base de distintas pruebas y análisis que tanto la incorporación de determinados módulos como una mayor optimización de los módulos que la componen supondrían una mejora en su eficacia.
The readability of images on the web tries to analyze what value the images add to the text that accompanies them, if this value is high the web pages will be more understandable, so users will use the web more and recommend it to their friends. This project arises from the verification after analysis that many web pages are not well designed, as they include images within them that do not add value, making the portals more difficult to understand. This is a problem from the accessibility point of view, since there may be people with disabilities or elderly people who cannot enjoy a satisfactory navigation on the Internet or who cannot understand the information presented, since the websites are poorly designed. The project includes the design and implementation of an application capable of measuring the readability of images on the web in order to locate the shortcomings of web design so that they can be corrected and make them more accessible. This work includes the implementation of a desktop application using the Python programming language, through a simple and intuitive graphical interface for users. Through this interface, users will be able to enter the URL of the subject page to be analyzed, view the text-image matching results obtained, and export the output to a JSON file. The web page entered by the user will be extracted, decomposed and cleaned of the various HTML elements. Once decomposed, the topic of the web texts will be determined thanks to the implemented natural language processing algorithm. The images will also be analyzed thanks to the optical character recognition algorithm, and once all this information has been extracted, the concordance between them will be calculated for the different pairs of elements, both image-paragraph and image-title. This will be shown to the user through an output in JSON format through the interface, and finally the user will be able to export this output in JSON format to his computer. The final evaluation of the application has been positive, although it has been verified based on different tests and analysis that both the incorporation of certain modules and a greater optimization of the modules that compose it would mean an improvement in its efficiency.
Description
Keywords
Lecturabilidad de las imágenes, Web
Bibliographic citation