Sistema de clasificación automática de críticas de cine

e-Archivo Repository

Show simple item record

dc.contributor.advisor Villena Román, Julio
dc.contributor.author Martín García, Miriam
dc.date.accessioned 2009-11-30T11:16:32Z
dc.date.available 2009-11-30T11:16:32Z
dc.date.issued 2009-07
dc.date.submitted 2009-07-10
dc.identifier.uri http://hdl.handle.net/10016/5846
dc.description.abstract Considerada inicialmente una subdisciplina de la tarea de clasificación de documentos, en los últimos años la clasificación de documentos basada en la opinión (conocida en inglés bajo los nombres de sentiment classification, sentiment analysis u opinion mining) ha sido objeto de un creciente interés por parte de la comunidad de investigadores del procesamiento del lenguaje natural. El creciente interés por el procesamiento automático de las opiniones contenidas en documentos de texto, es en parte consecuencia del aumento exponencial de contenidos generados por usuarios en la Web 2.0, y por el interés, entre otros, de empresas y administraciones públicas en analizar, filtrar o detectar automáticamente las opiniones vertidas por sus clientes o ciudadanos. Este Proyecto de Fin de Carrera tiene como objetivo el diseño y la implementación de un sistema de clasificación automática de textos de opinión, concretamente de críticas cinematográficas vertidas por usuarios de internet, recogidas en diferentes webs dedicadas a tal fin. Los documentos serán clasificados, en una de las categorías definidas en el sistema (de acuerdo a la orientación afectiva de las críticas), aplicando diversas técnicas para el procesamiento del lenguaje natural (se aplicará en un caso el algoritmo kNN y en otro caso se hará uso de un diccionario afectivo). El hecho de conseguir un sistema automático de clasificación evitará la intervención humana y aumentará la rapidez con que se pueden procesar este tipo de documentos. Con la realización de este proyecto, se comprobarán y analizarán también las dificultades encontradas en la implementación de un sistema de clasificación automática donde la naturaleza de los textos es de opinión. ____________________________________________________
dc.description.abstract As a subfield of document classification, Opinion based document classification (also known as sentiment classification, sentiment analysis or opinion mining) has been object of an increasing interest over the last years by the natural language research community. This focus on automatic opinion detection in text documents is due to the exponential increase of contents produced by Web 2.0 users, as well as to the interest of companies and public administrations to be able to analyse, filter or detect opinions expressed by their clients or citizens. The aim of this project is the design and implementation of an automatic opinion classification system, specifically, the classification of film reviews written by internet users that have been collected among different specialized websites. The documents will be classified into one of the defined system’s categories (according to the review’s affective orientation), applying diverse techniques for the natural language processing (both a kNN algorithm and an affective dictionary will be used). Such a kind of automatic classification system avoids any human intervention and considerably decreases the document’s manipulation time. Problems and difficulties found while implementing the system will be thoroughly commented and analysed.
dc.format.mimetype application/pdf
dc.language.iso spa
dc.rights Atribución-NoComercial-SinDerivadas 3.0 España
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subject.other Lingüística computacional
dc.subject.other Recuperación de la información
dc.subject.other Web
dc.subject.other Sistemas de clasificación de textos
dc.title Sistema de clasificación automática de críticas de cine
dc.type masterThesis
dc.subject.eciencia Informática
dc.rights.accessRights openAccess
dc.description.degree Ingeniería de Telecomunicación
dc.contributor.departamento Universidad Carlos III de Madrid. Departamento de Ingeniería Telemática
 Find Full text

Files in this item

*Click on file's image for preview. (Embargoed files's preview is not supported)


The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record