Publication:
Bayesian nonparametric modeling of psychiatric disorders

Loading...
Thumbnail Image
Identifiers
Publication date
2014-11
Defense date
2014-11-21
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
Mental health care has become one of the major priorities in developed countries, where the annual budgets assigned to mental health care reach hundreds of billion of dollars. Due to lack of laboratory tests as objective diagnostic criteria, there is not consensus among the psychiatrists either on the diagnostic criteria or the treatments. As a consequence, there exists an increasing interest in improving both the detection and treatment of mental disorders. This thesis is an interdisciplinary work, in which we study the causes behind suicide attempts and provide thorough analysis of pathological and comorbidity patterns of mental disorders. The final goal of this study is to help psychiatrists detect people with higher risk and guide them to improve treatments. To this end, we apply latent feature modeling to the National Epidemiologic Survey on Alcohol and Related Conditions (NESARC), which collects information about the mental health of the U.S. population. In order to avoid the model selection step needed to infer the number of variables in the latent feature model, we make use of the Indian Buffet Process (IBP) [27]. However, the discrete nature of the database does not allow us to use the standard Gaussian observation model, and therefore, we need to adapt the observation model to discrete random variables. In a first step, we propose an IBP model for categorical observations, which are the most common in the NESARC. We consider two likelihood observation models: a multinomial-logit and a multinomial-probit model. We derive efficient Monte-Carlo Markov chain (MCMC) inference algorithms that resort to either the Laplace approximation or the expectation propagation (EP) algorithm to compute the marginal likelihood. We also derive a variational inference algorithm that provides a less expensive, in terms of computational complexity, alternative to the samplers. Afterwards, to account for all the available information about the subjects (that includes also non categorical observations, such as age, incomes or education level), we extend the IBP observation model to handle mixed continuous (real-valued and positive real-valued) and discrete (categorical, ordinal and count) observations. This model keeps the properties of conjugate models and allows us to derive an inference algorithm that scales linearly with the number of observations. Finally, we present the experimental results obtained after applying the proposed models to the NESARC database, studying both the hidden causes behind suicide attempts and the pathological and comobidity patterns of mental disorders.
La salud mental se ha convertido en una de las principales prioridades de los países desarrollados, los cuales dedican anualmente cientos de miles de millones de dólares al cuidado de la misma. Debido a la falta de pruebas de laboratorio como criterios objetivos para el diagnóstico de los desórdenes mentales, existe una falta de consenso tanto en los criterios de diagnóstico como en los tratamiento. Esta tesis es un trabajo interdisciplinario que tiene como propósito encontrar las causas latentes detrás de los intentos de suicidio y proveer de un profundo análisis sobre los patrones, tanto patológicos como de comorbilidad, de los desórdenes psiquiátricos. Como objetivo final de este trabajo, pretendemos ayudar a los psiquiatras a detectar aquellas personas con mayor riesgo de sufrir de desórdenes mentales, y guiarlos en la categorización y los tratamientos para dichos desórdenes. Para ello, aplicamos modelado de características latentes a la base de datos NESARC (National Epidemiologic Survey on Alcohol and Related Conditions), la cual contiene información sobre la salud mental de una muestra representativa de la población estadounidense. Con el fin de evitar fijar la complejidad del modelo a priori, recurrimos al Indian Buffet Process (IBP) [27]. Sin embargo, debido a la naturaleza discreta de la base de datos, debemos adaptar a observaciones discretas el modelo de observación del IBP, que normalmente asume verosimilitudes Gaussianas. Inicialmente, adaptamos el modelo de observación del IBP a datos categóricos, los más comunes en la NESARC. Para ello, consideramos dos funciones de verosimilitud (la multinomial-logit y la multinomial-probit) y desarrollamos algoritmos de inferencia basados en muestreo (Monte-Carlo Markov chain) los cuales recurren a la aproximación de Laplace o al algoritmo Expectation Propagation para calcular la verosimilitud marginal. Adicionalmente, derivamos un algoritmo variacional que presenta menor complejidad que los algoritmos de muestreo. Después, con el fin de tener en cuenta en nuestro análisis toda la información disponible en la base de datos (que incluye otras variables no categóricas como la edad, los ingresos anuales o el nivel de estudios), proponemos un modelo de observación para el IBP que permite manejar bases de datos heterogéneas. Este modelo mantiene las propiedades de los modelos conjugados y permite derivar un algoritmo de inferencia de complejidad lineal con el número de observaciones. Finalmente, analizamos los resultados obtenidos al aplicar los modelos propuestos a la base de datos NESARC, estudiando tanto las causas latentes del suicidio como los patrones patológicos y de comorbilidad de los desórdenes mentales.
Description
Mención Internacional en el título de doctor
Keywords
Mental disorders, Observation models, Algorithms, Patterns, Bayesian nonparametrics
Bibliographic citation
Collections