Publication: Semantic resources in pharmacovigilance: a corpus and an ontology for drug-drug interactions
dc.contributor.advisor | Segura-Bedmar, Isabel | |
dc.contributor.advisor | MartĂnez FernĂ¡ndez, Paloma | |
dc.contributor.author | Herrero Zazo, MarĂa | |
dc.contributor.departamento | UC3M. Departamento de InformĂ¡tica | es |
dc.date.accessioned | 2015-09-28T15:55:31Z | |
dc.date.available | 2015-09-28T15:55:31Z | |
dc.date.issued | 2015 | |
dc.date.submitted | 2015-05-08 | |
dc.description | MenciĂ³n Internacional en el tĂtulo de doctor | |
dc.description.abstract | Nowadays, with the increasing use of several drugs for the treatment of one or more different diseases (polytherapy) in large populations, the risk for drugs combinations that have not been studied in pre-authorization clinical trials has increased. This provides a favourable setting for the occurrence of drug-drug interactions (DDIs), a common adverse drug reaction (ADR) representing an important risk to patients safety, and an increase in healthcare costs. Their early detection is, therefore, a main concern in the clinical setting. Although there are different databases supporting healthcare professionals in the detection of DDIs, the quality of these databases is very uneven, and the consistency of their content is limited. Furthermore, these databases do not scale well to the large and growing number of pharmacovigilance literature in recent years. In addition, large amounts of current and valuable information are hidden in published articles, scientific journals, books, and technical reports. Thus, the large number of DDI information sources has overwhelmed most healthcare professionals because it is not possible to remain up to date on everything published about DDIs. Computational methods can play a key role in the identification, explanation, and prediction of DDIs on a large scale, since they can be used to collect, analyze and manipulate large amounts of biological and pharmacological data. Natural language processing (NLP) techniques can be used to retrieve and extract DDI information from pharmacological texts, supporting researchers and healthcare professionals on the challenging task of searching DDI information among different and heterogeneous sources. However, these methods rely on the availability of specific resources providing the domain knowledge, such as databases, terminological vocabularies, corpora, ontologies, and so forth, which are necessary to address the Information Extraction (IE) tasks. In this thesis, we have developed two semantic resources for the DDI domain that make an important contribution to the research and development of IE systems for DDIs. We have reviewed and analyzed the existing corpora and ontologies relevant to this domain, based on their strengths and weaknesses, we have developed the DDI corpus and the ontology for drug-drug interactions (named DINTO). The DDI corpus has proven to fulfil the characteristics of a high-quality gold-standard, and has demonstrated its usefulness as a benchmark for the training and testing of different IE systems in the SemEval-2013 DDIExtraction shared task. Meanwhile, DINTO has been used and evaluated in two different applications. Firstly, it has been proven that the knowledge represented in the ontology can be used to infer DDIs and their different mechanisms. Secondly, we have provided a proof-of-concept of the contribution of DINTO to NLP, by providing the domain knowledge to be exploited by an IE pilot prototype. From these results, we believe that these two semantic resources will encourage further research into the application of computational methods to the early detection of DDIs. This work has been partially supported by the Regional Government of Madrid under the Research Network MA2VICMR [S2009/TIC-1542], by the Spanish Ministry of Education under the project MULTIMEDICA [TIN2010-20644-C03-01] and by the European Commission Seventh Framework Programme under TrendMiner project [FP7-ICT287863]. | en |
dc.description.abstract | Hoy en dĂa ha habido un notable aumento del nĂºmero de pacientes polimedicados que reciben simultĂ¡neamente varios fĂ¡rmacos para el tratamiento de una o varias enfermedades. Esta situaciĂ³n proporciona el escenario ideal para la prescripciĂ³n de combinaciones de fĂ¡rmacos que no han sido estudiadas previamente en ensayos clĂnicos, y puede dar lugar a un aumento de interacciones farmacolĂ³gicas (DDIs por sus siglas en inglĂ©s). Las interacciones entre fĂ¡rmacos son un tipo de reacciĂ³n adversa que supone no sĂ³lo un riesgo para los pacientes, sino tambiĂ©n una importante causa de aumento del gasto sanitario. Por lo tanto, su detecciĂ³n temprana es crucial en la prĂ¡ctica clĂnica. En la actualidad existen diversos recursos y bases de datos que pueden ayudar a los profesionales sanitarios en la detecciĂ³n de posibles interacciones farmacolĂ³gicas. Sin embargo, la calidad de su informaciĂ³n varĂa considerablemente de unos a otros, y la consistencia de sus contenidos es limitada. AdemĂ¡s, la actualizaciĂ³n de estos recursos es difĂcil debido al aumento que ha experimentado la literatura farmacolĂ³gica en los Ăºltimos años. De hecho, mucha informaciĂ³n sobre DDIs se encuentra dispersa en artĂculos, revistas cientĂficas, libros o informes tĂ©cnicos, lo que ha hecho que la mayorĂa de los profesionales sanitarios se hayan visto abrumados al intentar mantenerse actualizados en el dominio de las interacciones farmacolĂ³gicas. La ingenierĂa informĂ¡tica puede representar un papel fundamental en este campo permitiendo la identificaciĂ³n, explicaciĂ³n y predicciĂ³n de DDIs, ya que puede ayudar a recopilar, analizar y manipular grandes cantidades de datos biolĂ³gicos y farmacolĂ³gicos. En concreto, las tĂ©cnicas del procesamiento del lenguaje natural (PLN) pueden ayudar a recuperar y extraer informaciĂ³n sobre DDIs de textos farmacolĂ³gicos, ayudando a los investigadores y profesionales sanitarios en la complicada tarea de buscar esta informaciĂ³n en diversas fuentes. Sin embargo, el desarrollo de estos mĂ©todos depende de la disponibilidad de recursos especĂficos que proporcionen el conocimiento del dominio, como bases de datos, vocabularios terminolĂ³gicos, corpora u ontologĂas, entre otros, que son necesarios para desarrollar las tareas de extracciĂ³n de informaciĂ³n (EI). En el marco de esta tesis hemos desarrollado dos recursos semĂ¡nticos en el dominio de las interacciones farmacolĂ³gicas que suponen una importante contribuciĂ³n a la investigaciĂ³n y al desarrollo de sistemas de EI sobre DDIs. En primer lugar hemos revisado y analizado los corpora y ontologĂas existentes relevantes para el dominio y, en base a sus potenciales y limitaciones, hemos desarrollado el corpus DDI y la ontologĂa para interacciones farmacolĂ³gicas DINTO. El corpus DDI ha demostrado cumplir con las caracterĂsticas de un estĂ¡ndar de oro de gran calidad, asĂ como su utilidad para el entrenamiento y evaluaciĂ³n de distintos sistemas en la tarea de extracciĂ³n de informaciĂ³n SemEval-2013 DDIExtraction Task. Por su parte, DINTO ha sido utilizada y evaluada en dos aplicaciones diferentes. En primer lugar, hemos demostrado que esta ontologĂa puede ser utilizada para inferir interacciones entre fĂ¡rmacos y los mecanismos por los que ocurren. En segundo lugar, hemos obtenido una primera prueba de concepto de la contribuciĂ³n de DINTO al Ă¡rea del PLN al proporcionar el conocimiento del dominio necesario para ser explotado por un prototipo de un sistema de EI. En vista de estos resultados, creemos que estos dos recursos semĂ¡nticos pueden estimular la investigaciĂ³n en el desarrollo de mĂ©todos computaciones para la detecciĂ³n temprana de DDIs. Este trabajo ha sido financiado parcialmente por el Gobierno Regional de Madrid a travĂ©s de la red de investigaciĂ³n MA2VICMR [S2009/TIC-1542], por el Ministerio de EducaciĂ³n Español, a travĂ©s del proyecto MULTIMEDICA [TIN2010-20644-C03-01], y por el SĂ©ptimo Programa Macro de la ComisiĂ³n Europea a travĂ©s del proyecto TrendMiner [FP7-ICT287863]. | es |
dc.description.degree | Programa Oficial de Doctorado en Ciencia y TecnologĂa InformĂ¡tica | es |
dc.description.responsability | Presidente: AsunciĂ³n GĂ³mez PĂ©rez.- Secretario: MarĂa BelĂ©n Ruiz Mezcua.- Vocal: Mariana Neves | es |
dc.description.sponsorship | This work has been partially supported by the Regional Government of Madrid under the Research Network MA2VICMR [S2009/TIC-1542], by the Spanish Ministry of Education under the project MULTIMEDICA [TIN2010-20644-C03-01] and by the European Commission Seventh Framework Programme under TrendMiner project [FP7-ICT287863]. | en |
dc.format.mimetype | application/pdf | |
dc.identifier.uri | https://hdl.handle.net/10016/21629 | |
dc.language.iso | eng | es |
dc.relation.projectID | Comunidad de Madrid. S2009/TIC-1542/MA2VICMR | es |
dc.relation.projectID | Gobierno de España. TIN2010-20644-C03-01/MULTIMEDICA | es |
dc.relation.projectID | info:eu-repo/grantAgreement/EC/FP7/287863 | en |
dc.rights | AtribuciĂ³n-NoComercial-SinDerivadas 3.0 España | * |
dc.rights.accessRights | open access | es |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | * |
dc.subject.eciencia | InformĂ¡tica | es |
dc.subject.other | Corpus | en |
dc.subject.other | Ontology | en |
dc.subject.other | Knowledge representation | en |
dc.subject.other | Pharmacovigilance | en |
dc.subject.other | Drug-drug interaction | en |
dc.subject.other | Natural language processing | en |
dc.subject.other | Information extraction | en |
dc.subject.other | Inference | en |
dc.subject.other | OntologĂa | es |
dc.subject.other | RepresentaciĂ³n del conocimiento | es |
dc.subject.other | Farmacovigilancia | es |
dc.subject.other | InteracciĂ³n farmacolĂ³gica | es |
dc.subject.other | Procesamiento del lenguaje natural | es |
dc.subject.other | ExtracciĂ³n de informaciĂ³n | es |
dc.subject.other | Inferencia | es |
dc.title | Semantic resources in pharmacovigilance: a corpus and an ontology for drug-drug interactions | en |
dc.type | doctoral thesis | * |
dspace.entity.type | Publication |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- tesis_maria_herrero_zazo_2015.pdf
- Size:
- 9.74 MB
- Format:
- Adobe Portable Document Format