Publication:
Semantic resources in pharmacovigilance: a corpus and an ontology for drug-drug interactions

dc.contributor.advisorSegura-Bedmar, Isabel
dc.contributor.advisorMartĂ­nez FernĂ¡ndez, Paloma
dc.contributor.authorHerrero Zazo, MarĂ­a
dc.contributor.departamentoUC3M. Departamento de InformĂ¡ticaes
dc.date.accessioned2015-09-28T15:55:31Z
dc.date.available2015-09-28T15:55:31Z
dc.date.issued2015
dc.date.submitted2015-05-08
dc.descriptionMenciĂ³n Internacional en el tĂ­tulo de doctor
dc.description.abstractNowadays, with the increasing use of several drugs for the treatment of one or more different diseases (polytherapy) in large populations, the risk for drugs combinations that have not been studied in pre-authorization clinical trials has increased. This provides a favourable setting for the occurrence of drug-drug interactions (DDIs), a common adverse drug reaction (ADR) representing an important risk to patients safety, and an increase in healthcare costs. Their early detection is, therefore, a main concern in the clinical setting. Although there are different databases supporting healthcare professionals in the detection of DDIs, the quality of these databases is very uneven, and the consistency of their content is limited. Furthermore, these databases do not scale well to the large and growing number of pharmacovigilance literature in recent years. In addition, large amounts of current and valuable information are hidden in published articles, scientific journals, books, and technical reports. Thus, the large number of DDI information sources has overwhelmed most healthcare professionals because it is not possible to remain up to date on everything published about DDIs. Computational methods can play a key role in the identification, explanation, and prediction of DDIs on a large scale, since they can be used to collect, analyze and manipulate large amounts of biological and pharmacological data. Natural language processing (NLP) techniques can be used to retrieve and extract DDI information from pharmacological texts, supporting researchers and healthcare professionals on the challenging task of searching DDI information among different and heterogeneous sources. However, these methods rely on the availability of specific resources providing the domain knowledge, such as databases, terminological vocabularies, corpora, ontologies, and so forth, which are necessary to address the Information Extraction (IE) tasks. In this thesis, we have developed two semantic resources for the DDI domain that make an important contribution to the research and development of IE systems for DDIs. We have reviewed and analyzed the existing corpora and ontologies relevant to this domain, based on their strengths and weaknesses, we have developed the DDI corpus and the ontology for drug-drug interactions (named DINTO). The DDI corpus has proven to fulfil the characteristics of a high-quality gold-standard, and has demonstrated its usefulness as a benchmark for the training and testing of different IE systems in the SemEval-2013 DDIExtraction shared task. Meanwhile, DINTO has been used and evaluated in two different applications. Firstly, it has been proven that the knowledge represented in the ontology can be used to infer DDIs and their different mechanisms. Secondly, we have provided a proof-of-concept of the contribution of DINTO to NLP, by providing the domain knowledge to be exploited by an IE pilot prototype. From these results, we believe that these two semantic resources will encourage further research into the application of computational methods to the early detection of DDIs. This work has been partially supported by the Regional Government of Madrid under the Research Network MA2VICMR [S2009/TIC-1542], by the Spanish Ministry of Education under the project MULTIMEDICA [TIN2010-20644-C03-01] and by the European Commission Seventh Framework Programme under TrendMiner project [FP7-ICT287863].en
dc.description.abstractHoy en dĂ­a ha habido un notable aumento del nĂºmero de pacientes polimedicados que reciben simultĂ¡neamente varios fĂ¡rmacos para el tratamiento de una o varias enfermedades. Esta situaciĂ³n proporciona el escenario ideal para la prescripciĂ³n de combinaciones de fĂ¡rmacos que no han sido estudiadas previamente en ensayos clĂ­nicos, y puede dar lugar a un aumento de interacciones farmacolĂ³gicas (DDIs por sus siglas en inglĂ©s). Las interacciones entre fĂ¡rmacos son un tipo de reacciĂ³n adversa que supone no sĂ³lo un riesgo para los pacientes, sino tambiĂ©n una importante causa de aumento del gasto sanitario. Por lo tanto, su detecciĂ³n temprana es crucial en la prĂ¡ctica clĂ­nica. En la actualidad existen diversos recursos y bases de datos que pueden ayudar a los profesionales sanitarios en la detecciĂ³n de posibles interacciones farmacolĂ³gicas. Sin embargo, la calidad de su informaciĂ³n varĂ­a considerablemente de unos a otros, y la consistencia de sus contenidos es limitada. AdemĂ¡s, la actualizaciĂ³n de estos recursos es difĂ­cil debido al aumento que ha experimentado la literatura farmacolĂ³gica en los Ăºltimos años. De hecho, mucha informaciĂ³n sobre DDIs se encuentra dispersa en artĂ­culos, revistas cientĂ­ficas, libros o informes tĂ©cnicos, lo que ha hecho que la mayorĂ­a de los profesionales sanitarios se hayan visto abrumados al intentar mantenerse actualizados en el dominio de las interacciones farmacolĂ³gicas. La ingenierĂ­a informĂ¡tica puede representar un papel fundamental en este campo permitiendo la identificaciĂ³n, explicaciĂ³n y predicciĂ³n de DDIs, ya que puede ayudar a recopilar, analizar y manipular grandes cantidades de datos biolĂ³gicos y farmacolĂ³gicos. En concreto, las tĂ©cnicas del procesamiento del lenguaje natural (PLN) pueden ayudar a recuperar y extraer informaciĂ³n sobre DDIs de textos farmacolĂ³gicos, ayudando a los investigadores y profesionales sanitarios en la complicada tarea de buscar esta informaciĂ³n en diversas fuentes. Sin embargo, el desarrollo de estos mĂ©todos depende de la disponibilidad de recursos especĂ­ficos que proporcionen el conocimiento del dominio, como bases de datos, vocabularios terminolĂ³gicos, corpora u ontologĂ­as, entre otros, que son necesarios para desarrollar las tareas de extracciĂ³n de informaciĂ³n (EI). En el marco de esta tesis hemos desarrollado dos recursos semĂ¡nticos en el dominio de las interacciones farmacolĂ³gicas que suponen una importante contribuciĂ³n a la investigaciĂ³n y al desarrollo de sistemas de EI sobre DDIs. En primer lugar hemos revisado y analizado los corpora y ontologĂ­as existentes relevantes para el dominio y, en base a sus potenciales y limitaciones, hemos desarrollado el corpus DDI y la ontologĂ­a para interacciones farmacolĂ³gicas DINTO. El corpus DDI ha demostrado cumplir con las caracterĂ­sticas de un estĂ¡ndar de oro de gran calidad, asĂ­ como su utilidad para el entrenamiento y evaluaciĂ³n de distintos sistemas en la tarea de extracciĂ³n de informaciĂ³n SemEval-2013 DDIExtraction Task. Por su parte, DINTO ha sido utilizada y evaluada en dos aplicaciones diferentes. En primer lugar, hemos demostrado que esta ontologĂ­a puede ser utilizada para inferir interacciones entre fĂ¡rmacos y los mecanismos por los que ocurren. En segundo lugar, hemos obtenido una primera prueba de concepto de la contribuciĂ³n de DINTO al Ă¡rea del PLN al proporcionar el conocimiento del dominio necesario para ser explotado por un prototipo de un sistema de EI. En vista de estos resultados, creemos que estos dos recursos semĂ¡nticos pueden estimular la investigaciĂ³n en el desarrollo de mĂ©todos computaciones para la detecciĂ³n temprana de DDIs. Este trabajo ha sido financiado parcialmente por el Gobierno Regional de Madrid a travĂ©s de la red de investigaciĂ³n MA2VICMR [S2009/TIC-1542], por el Ministerio de EducaciĂ³n Español, a travĂ©s del proyecto MULTIMEDICA [TIN2010-20644-C03-01], y por el SĂ©ptimo Programa Macro de la ComisiĂ³n Europea a travĂ©s del proyecto TrendMiner [FP7-ICT287863].es
dc.description.degreePrograma Oficial de Doctorado en Ciencia y TecnologĂ­a InformĂ¡ticaes
dc.description.responsabilityPresidente: AsunciĂ³n GĂ³mez PĂ©rez.- Secretario: MarĂ­a BelĂ©n Ruiz Mezcua.- Vocal: Mariana Neveses
dc.description.sponsorshipThis work has been partially supported by the Regional Government of Madrid under the Research Network MA2VICMR [S2009/TIC-1542], by the Spanish Ministry of Education under the project MULTIMEDICA [TIN2010-20644-C03-01] and by the European Commission Seventh Framework Programme under TrendMiner project [FP7-ICT287863].en
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://hdl.handle.net/10016/21629
dc.language.isoenges
dc.relation.projectIDComunidad de Madrid. S2009/TIC-1542/MA2VICMRes
dc.relation.projectIDGobierno de España. TIN2010-20644-C03-01/MULTIMEDICAes
dc.relation.projectIDinfo:eu-repo/grantAgreement/EC/FP7/287863en
dc.rightsAtribuciĂ³n-NoComercial-SinDerivadas 3.0 España*
dc.rights.accessRightsopen accesses
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.subject.ecienciaInformĂ¡ticaes
dc.subject.otherCorpusen
dc.subject.otherOntologyen
dc.subject.otherKnowledge representationen
dc.subject.otherPharmacovigilanceen
dc.subject.otherDrug-drug interactionen
dc.subject.otherNatural language processingen
dc.subject.otherInformation extractionen
dc.subject.otherInferenceen
dc.subject.otherOntologĂ­aes
dc.subject.otherRepresentaciĂ³n del conocimientoes
dc.subject.otherFarmacovigilanciaes
dc.subject.otherInteracciĂ³n farmacolĂ³gicaes
dc.subject.otherProcesamiento del lenguaje naturales
dc.subject.otherExtracciĂ³n de informaciĂ³nes
dc.subject.otherInferenciaes
dc.titleSemantic resources in pharmacovigilance: a corpus and an ontology for drug-drug interactionsen
dc.typedoctoral thesis*
dspace.entity.typePublication
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
tesis_maria_herrero_zazo_2015.pdf
Size:
9.74 MB
Format:
Adobe Portable Document Format