Publication: Bayesian nonparametric modeling of psychiatric disorders
Loading...
Identifiers
Publication date
2014-11
Defense date
2014-11-21
Authors
Advisors
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Mental health care has become one of the major priorities in developed
countries, where the annual budgets assigned to mental health care reach
hundreds of billion of dollars. Due to lack of laboratory tests as objective
diagnostic criteria, there is not consensus among the psychiatrists either on
the diagnostic criteria or the treatments. As a consequence, there exists
an increasing interest in improving both the detection and treatment of
mental disorders. This thesis is an interdisciplinary work, in which we
study the causes behind suicide attempts and provide thorough analysis
of pathological and comorbidity patterns of mental disorders. The final goal
of this study is to help psychiatrists detect people with higher risk and guide
them to improve treatments. To this end, we apply latent feature modeling
to the National Epidemiologic Survey on Alcohol and Related Conditions
(NESARC), which collects information about the mental health of the U.S.
population. In order to avoid the model selection step needed to infer the
number of variables in the latent feature model, we make use of the Indian
Buffet Process (IBP) [27]. However, the discrete nature of the database does
not allow us to use the standard Gaussian observation model, and therefore,
we need to adapt the observation model to discrete random variables.
In a first step, we propose an IBP model for categorical observations,
which are the most common in the NESARC. We consider two likelihood
observation models: a multinomial-logit and a multinomial-probit model.
We derive efficient Monte-Carlo Markov chain (MCMC) inference algorithms
that resort to either the Laplace approximation or the expectation
propagation (EP) algorithm to compute the marginal likelihood. We also
derive a variational inference algorithm that provides a less expensive, in
terms of computational complexity, alternative to the samplers. Afterwards,
to account for all the available information about the subjects (that
includes also non categorical observations, such as age, incomes or education level), we extend the IBP observation model to handle mixed continuous
(real-valued and positive real-valued) and discrete (categorical, ordinal
and count) observations. This model keeps the properties of conjugate
models and allows us to derive an inference algorithm that scales linearly
with the number of observations. Finally, we present the experimental
results obtained after applying the proposed models to the NESARC
database, studying both the hidden causes behind suicide attempts and
the pathological and comobidity patterns of mental disorders.
La salud mental se ha convertido en una de las principales prioridades de los países desarrollados, los cuales dedican anualmente cientos de miles de millones de dólares al cuidado de la misma. Debido a la falta de pruebas de laboratorio como criterios objetivos para el diagnóstico de los desórdenes mentales, existe una falta de consenso tanto en los criterios de diagnóstico como en los tratamiento. Esta tesis es un trabajo interdisciplinario que tiene como propósito encontrar las causas latentes detrás de los intentos de suicidio y proveer de un profundo análisis sobre los patrones, tanto patológicos como de comorbilidad, de los desórdenes psiquiátricos. Como objetivo final de este trabajo, pretendemos ayudar a los psiquiatras a detectar aquellas personas con mayor riesgo de sufrir de desórdenes mentales, y guiarlos en la categorización y los tratamientos para dichos desórdenes. Para ello, aplicamos modelado de características latentes a la base de datos NESARC (National Epidemiologic Survey on Alcohol and Related Conditions), la cual contiene información sobre la salud mental de una muestra representativa de la población estadounidense. Con el fin de evitar fijar la complejidad del modelo a priori, recurrimos al Indian Buffet Process (IBP) [27]. Sin embargo, debido a la naturaleza discreta de la base de datos, debemos adaptar a observaciones discretas el modelo de observación del IBP, que normalmente asume verosimilitudes Gaussianas. Inicialmente, adaptamos el modelo de observación del IBP a datos categóricos, los más comunes en la NESARC. Para ello, consideramos dos funciones de verosimilitud (la multinomial-logit y la multinomial-probit) y desarrollamos algoritmos de inferencia basados en muestreo (Monte-Carlo Markov chain) los cuales recurren a la aproximación de Laplace o al algoritmo Expectation Propagation para calcular la verosimilitud marginal. Adicionalmente, derivamos un algoritmo variacional que presenta menor complejidad que los algoritmos de muestreo. Después, con el fin de tener en cuenta en nuestro análisis toda la información disponible en la base de datos (que incluye otras variables no categóricas como la edad, los ingresos anuales o el nivel de estudios), proponemos un modelo de observación para el IBP que permite manejar bases de datos heterogéneas. Este modelo mantiene las propiedades de los modelos conjugados y permite derivar un algoritmo de inferencia de complejidad lineal con el número de observaciones. Finalmente, analizamos los resultados obtenidos al aplicar los modelos propuestos a la base de datos NESARC, estudiando tanto las causas latentes del suicidio como los patrones patológicos y de comorbilidad de los desórdenes mentales.
La salud mental se ha convertido en una de las principales prioridades de los países desarrollados, los cuales dedican anualmente cientos de miles de millones de dólares al cuidado de la misma. Debido a la falta de pruebas de laboratorio como criterios objetivos para el diagnóstico de los desórdenes mentales, existe una falta de consenso tanto en los criterios de diagnóstico como en los tratamiento. Esta tesis es un trabajo interdisciplinario que tiene como propósito encontrar las causas latentes detrás de los intentos de suicidio y proveer de un profundo análisis sobre los patrones, tanto patológicos como de comorbilidad, de los desórdenes psiquiátricos. Como objetivo final de este trabajo, pretendemos ayudar a los psiquiatras a detectar aquellas personas con mayor riesgo de sufrir de desórdenes mentales, y guiarlos en la categorización y los tratamientos para dichos desórdenes. Para ello, aplicamos modelado de características latentes a la base de datos NESARC (National Epidemiologic Survey on Alcohol and Related Conditions), la cual contiene información sobre la salud mental de una muestra representativa de la población estadounidense. Con el fin de evitar fijar la complejidad del modelo a priori, recurrimos al Indian Buffet Process (IBP) [27]. Sin embargo, debido a la naturaleza discreta de la base de datos, debemos adaptar a observaciones discretas el modelo de observación del IBP, que normalmente asume verosimilitudes Gaussianas. Inicialmente, adaptamos el modelo de observación del IBP a datos categóricos, los más comunes en la NESARC. Para ello, consideramos dos funciones de verosimilitud (la multinomial-logit y la multinomial-probit) y desarrollamos algoritmos de inferencia basados en muestreo (Monte-Carlo Markov chain) los cuales recurren a la aproximación de Laplace o al algoritmo Expectation Propagation para calcular la verosimilitud marginal. Adicionalmente, derivamos un algoritmo variacional que presenta menor complejidad que los algoritmos de muestreo. Después, con el fin de tener en cuenta en nuestro análisis toda la información disponible en la base de datos (que incluye otras variables no categóricas como la edad, los ingresos anuales o el nivel de estudios), proponemos un modelo de observación para el IBP que permite manejar bases de datos heterogéneas. Este modelo mantiene las propiedades de los modelos conjugados y permite derivar un algoritmo de inferencia de complejidad lineal con el número de observaciones. Finalmente, analizamos los resultados obtenidos al aplicar los modelos propuestos a la base de datos NESARC, estudiando tanto las causas latentes del suicidio como los patrones patológicos y de comorbilidad de los desórdenes mentales.
Description
Mención Internacional en el título de doctor
Keywords
Mental disorders, Observation models, Algorithms, Patterns, Bayesian nonparametrics