RT Dissertation/Thesis T1 Lexical simplification for the systematic support of cognitive accessibility guidelines A1 Alarcón García, Rodrigo AB The Internet has come a long way in recent years, contributing to the proliferation oflarge volumes of digitally available information. Through user interfaces we can accessthese contents, however, they are not accessible to everyone. The main users affected arepeople with disabilities, who are already a considerable number, but accessibility barriersaffect a wide range of user groups and contexts of use in accessing digital information.Some of these barriers are caused by language inaccessibility when texts contain longsentences, unusual words and complex linguistic structures. These accessibility barriersdirectly affect people with cognitive disabilities.For the purpose of making textual content more accessible, there are initiatives suchas the Easy Reading guidelines, the Plain Language guidelines and some of the languagespecificWeb Content Accessibility Guidelines (WCAG). These guidelines provide documentation,but do not specify methods for meeting the requirements implicit in theseguidelines in a systematic way. To obtain a solution, methods from the Natural LanguageProcessing (NLP) discipline can provide support for achieving compliance with the cognitiveaccessibility guidelines for the language.The task of text simplification aims at reducing the linguistic complexity of a text froma syntactic and lexical perspective, the latter being the main focus of this Thesis. In thissense, one solution space is to identify in a text which words are complex or uncommon,and in the case that there were, to provide a more usual and simpler synonym, togetherwith a simple definition, all oriented to people with cognitive disabilities.With this goal in mind, this Thesis presents the study, analysis, design and developmentof an architecture, NLP methods, resources and tools for the lexical simplification oftexts for the Spanish language in a generic domain in the field of cognitive accessibility.To achieve this, each of the steps present in the lexical simplification processes is studied,together with methods for word sense disambiguation. As a contribution, differenttypes of word embedding are explored and created, supported by traditional and dynamicembedding methods, such as transfer learning methods. In addition, since most of theNLP methods require data for their operation, a resource in the framework of cognitiveaccessibility is presented as a contribution. AB Internet ha avanzado mucho en los últimos años contribuyendo a la proliferación degrandes volúmenes de información disponible digitalmente. A través de interfaces deusuario podemos acceder a estos contenidos, sin embargo, estos no son accesibles a todaslas personas. Los usuarios afectados principalmente son las personas con discapacidadsiendo ya un número considerable, pero las barreras de accesibilidad afectan a un granrango de grupos de usuarios y contextos de uso en el acceso a la información digital. Algunasde estas barreras son causadas por la inaccesibilidad al lenguaje cuando los textoscontienen oraciones largas, palabras inusuales y estructuras lingüísticas complejas. Estasbarreras de accesibilidad afectan directamente a las personas con discapacidad cognitiva.Con el fin de hacer el contenido textual más accesible, existen iniciativas como laspautas de Lectura Fácil, las pautas de Lenguaje Claro y algunas de las pautas de Accesibilidadal Contenido en la Web (WCAG) específicas para el lenguaje. Estas pautasproporcionan documentación, pero no especifican métodos para cumplir con los requisitosimplícitos en estas pautas de manera sistemática. Para obtener una solución, losmétodos de la disciplina del Procesamiento del Lenguaje Natural (PLN) pueden dar unsoporte para alcanzar la conformidad con las pautas de accesibilidad cognitiva relativas allenguajeLa tarea de la simplificación de textos del PLN tiene como objetivo reducir la complejidadlingüística de un texto desde una perspectiva sintáctica y léxica, siendo esta últimael enfoque principal de esta Tesis. En este sentido, un espacio de solución es identificaren un texto qué palabras son complejas o poco comunes, y en el caso de que sí hubiera,proporcionar un sinónimo más usual y sencillo, junto con una definición sencilla, todoello orientado a las personas con discapacidad cognitiva.Con tal meta, en esta Tesis, se presenta el estudio, análisis, diseño y desarrollo deuna arquitectura, métodos PLN, recursos y herramientas para la simplificación léxica detextos para el idioma español en un dominio genérico en el ámbito de la accesibilidadcognitiva. Para lograr esto, se estudia cada uno de los pasos presentes en los procesosde simplificación léxica, junto con métodos para la desambiguación del sentido de laspalabras. Como contribución, diferentes tipos de word embedding son explorados y creados,apoyados por métodos embedding tradicionales y dinámicos, como son los métodosde transfer learning. Además, debido a que gran parte de los métodos PLN requierendatos para su funcionamiento, se presenta como contribución un recurso en el marco dela accesibilidad cognitiva. YR 2022 FD 2022-01 LK https://hdl.handle.net/10016/35140 UL https://hdl.handle.net/10016/35140 LA eng DS e-Archivo RD 1 sept. 2024