Publication: Evaluación de la extracción de entidades nombradas de OpenCalais en castellano
dc.affiliation.dpto | UC3M. Departamento de Informática | es |
dc.affiliation.grupoinv | UC3M. Grupo de Investigación: Human Language and Accessibility Technologies (HULAT) | es |
dc.contributor.author | Toribio, Raquel | |
dc.contributor.author | Martínez Fernández, Paloma | |
dc.contributor.author | Pablo-Sánchez, César de | |
dc.date.accessioned | 2015-04-17T08:38:40Z | |
dc.date.available | 2015-04-17T08:38:40Z | |
dc.date.issued | 2010-09 | |
dc.description.abstract | En los últimos años se han popularizado herramientas de Extracción de Información comerciales dentro del ecosistema de servicios de la Web Semántica. OpenCalais ofrece actualmente reconocimiento y categorización de Entidades Nombradas en castellano de fácil integración en aplicaciones de PLN. Hemos evaluado esta herramienta de anotación de entidades en el corpus de noticias CoNLL 2002. OpenCalais obtiene valores de precisión aceptables en las principales clases (persona, lugares y organización). Sin embargo, en comparación con los prototipos de investigación en castellano puede mejorar la cobertura y el tratamiento de la ambigüedad. | en |
dc.description.abstract | The Semantic Web ecosystem has seen the growing popularity of commercial Information Extraction services. Among them, OpenCalais provides Named Entity Recognition and Classification in Spanish. We have evaluated this service in the CONLL 2002 news corpus. The precision results are good enough for the development of applications that use the main classes (person, location and organization). However, recall and the treatment of ambiguous entities could be improved to be in pair with research prototypes. | en |
dc.description.sponsorship | Este trabajo ha sido parcialmente financiado por la red MA2VICMR (S2009/TIC-1542) y por el proyecto BRAVO (TIN2007-67407-C03-01) | en |
dc.description.status | Publicado | |
dc.format.extent | 4 | |
dc.format.mimetype | application/pdf | |
dc.identifier.bibliographicCitation | Procesamiento del Lenguaje Natural 45 (2010) pp. 287-290 | es |
dc.identifier.issn | 1989-7553 (online) | |
dc.identifier.issn | 1135-5948 (print) | |
dc.identifier.publicationfirstpage | 287 | |
dc.identifier.publicationissue | 45 | |
dc.identifier.publicationlastpage | 290 | |
dc.identifier.publicationtitle | Procesamiento del lenguaje natural | es |
dc.identifier.uri | https://hdl.handle.net/10016/20443 | |
dc.identifier.uxxi | AR/0000008123 | |
dc.language.iso | spa | |
dc.publisher | Sociedad Española para el Procesamiento del Lenguaje Natural | es |
dc.relation.projectID | Comunidad de Madrid. S2009/TIC-1542/MA2VICMR | es |
dc.relation.publisherversion | http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/811/665 | es |
dc.rights | © 2010 Sociedad Española para el Procesamiento del Lenguaje Natural | es |
dc.rights | © 2010 Autores | es |
dc.rights.accessRights | open access | |
dc.subject.eciencia | Informática | es |
dc.subject.other | Reconocimiento y Clasificación de Entidades Nombradas | en |
dc.subject.other | Evaluación | en |
dc.subject.other | Extracción de información | en |
dc.subject.other | Web semántica | en |
dc.subject.other | Castellano | en |
dc.subject.other | Named Entity Recognition and Classification | en |
dc.subject.other | Evaluation | en |
dc.subject.other | Information extraction | en |
dc.subject.other | Spanish | en |
dc.title | Evaluación de la extracción de entidades nombradas de OpenCalais en castellano | es |
dc.title.alternative | Evaluation of Named Entity Recognition in Spanish with OpenCalais | en |
dc.type | research article | * |
dc.type.hasVersion | VoR | * |
dspace.entity.type | Publication |
Files
Original bundle
1 - 1 of 1