Publication: Functional linear models
Loading...
Identifiers
Publication date
2015-07
Defense date
2015-07-21
Authors
Advisors
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
This work aims at the exposition of two different results we have obtained in Functional Data Analysis. The first is a variable selection method in Functional Regression which is an adaptation of the well known Lasso technique.
The second is a brand new Random Walk test for Functional Time Series.
Being the results afferent to different areas of Functional Data Analysis, as well as of general Statistics, the introduction will be divided in three parts.
Firstly we expose the fundamentals of Functional Data Analysis. Then we will recall some variable selection methods in ordinary Linear Regression.
Finally we will review some basics of Time Series analysis and brie y review some existing Random Walk tests. These introductory sections will motivate our research putting it in a general framework. Since Functional Data Analysis can be seen as a data reduction method we will talk incidentally of Big Data and we will provide some comments on the current definition of it.
All results of our research are supported by extensive computer simulations and in general, all of FDA is based on extensive computer deployment so some attention will be given to software and computation methods. The Lasso has been used in Functional Regression before this work, our contribution is twofold, we provide a reduction of Lasso in Functional Regression from a functional optimization problem to a numerical one via algebraic manipulations, no sampling is required. Then, we augment the Lasso with a post hoc analysis method which helps deciding which regressors have to be dropped, we called this augmented strategy The Shaked Lasso. About testing if a Functional Autoregressive Process can be considered a Random
Walk, our proposed test, as far as we could establish, is the first one in
literature.
En esta tesis se abordan dos problemas relacionados con el análisis de datos funcionales. El primero consiste en selecciĂłn de variables en un problema de regresiĂłn con respuesta funcional adaptando la tĂ©cnica conocida como Lasso. El segundo problema pretende abrir una lĂnea nueva de investigaciĂłn proponiendo un test para contrastar si una serie temporal funcional puede ser considerada como un camino aleatorio. Como los resultados que se muestran en esta tesis están relacionados con áreas diferentes del análisis de datos funcionales y de la estadĂstica en general, la IntroducciĂłn está dividida en tres partes. En primer lugar, se exponen los fundamentos del análisis de datos funcionales. En la segunda secciĂłn se revisan algunos mĂ©todos de selecciĂłn de variables en regresiĂłn lineal y por Ăşltimo, se recopilan brevemente las bases de series temporales asĂ como los contrastes de hipĂłtesis que se han utilizado en la literatura para contrastar caminos aleatorios. Estas secciones introductorias ayudan a motivar las aportaciones de la tesis encuadrándolas en su entorno de investigaciĂłn. Además, ya que el análisis de datos funcionales se puede ver como un mĂ©todo de reducciĂłn de la dimensiĂłn de los datos, se incluirán algunos comentarios sobre Big Data y sus definiciones. Todos los resultados de nuestra investigaciĂłn están soportados por un extenso trabajo de simulaciĂłn y, puesto que en los mĂ©todos estadĂsticos aplicados a datos funcionales es esencial la parte de computaciĂłn, se ha prestado especial atenciĂłn a todos los aspectos relacionados con el software y la modelizaciĂłn. El procedimiento Lasso de selecciĂłn de variables se ha aplicado anteriormente en la literatura de regresiĂłn funcional pero no a los modelos que se analizan en la tesis. Las contribuciones en este aspecto son dos: por una parte se proporciona un mĂ©todo de selecciĂłn de variables Lasso para un problema de regresiĂłn con respuesta funcional convirtiendo un problema de optimizaciĂłn funcional a un problema de optimizaciĂłn numĂ©rica vĂa manipulaciones algebraicas y sin necesidad de remuestreo. DespuĂ©s de ejecutar el problema de optimizaciĂłn, como segunda contribuciĂłn se propone un análisis de las soluciones para decidir los regresores que deben ser eliminados. Este segundo análisis se ha denominado The Shaked Lasso porque se basa en alterar un parámetro del proceso de optimizaciĂłn para observar cĂłmo se mueven las soluciones. Respecto al segundo capĂtulo de contribuciones de la tesis, se propone un contraste de hipĂłtesis para testear si un proceso autoregresivo funcional se puede considerar como un camino aleatorio. Hasta lo que nosotros conocemos en la literatura en este campo, es el primer test de este tipo que se propone en la literatura.
En esta tesis se abordan dos problemas relacionados con el análisis de datos funcionales. El primero consiste en selecciĂłn de variables en un problema de regresiĂłn con respuesta funcional adaptando la tĂ©cnica conocida como Lasso. El segundo problema pretende abrir una lĂnea nueva de investigaciĂłn proponiendo un test para contrastar si una serie temporal funcional puede ser considerada como un camino aleatorio. Como los resultados que se muestran en esta tesis están relacionados con áreas diferentes del análisis de datos funcionales y de la estadĂstica en general, la IntroducciĂłn está dividida en tres partes. En primer lugar, se exponen los fundamentos del análisis de datos funcionales. En la segunda secciĂłn se revisan algunos mĂ©todos de selecciĂłn de variables en regresiĂłn lineal y por Ăşltimo, se recopilan brevemente las bases de series temporales asĂ como los contrastes de hipĂłtesis que se han utilizado en la literatura para contrastar caminos aleatorios. Estas secciones introductorias ayudan a motivar las aportaciones de la tesis encuadrándolas en su entorno de investigaciĂłn. Además, ya que el análisis de datos funcionales se puede ver como un mĂ©todo de reducciĂłn de la dimensiĂłn de los datos, se incluirán algunos comentarios sobre Big Data y sus definiciones. Todos los resultados de nuestra investigaciĂłn están soportados por un extenso trabajo de simulaciĂłn y, puesto que en los mĂ©todos estadĂsticos aplicados a datos funcionales es esencial la parte de computaciĂłn, se ha prestado especial atenciĂłn a todos los aspectos relacionados con el software y la modelizaciĂłn. El procedimiento Lasso de selecciĂłn de variables se ha aplicado anteriormente en la literatura de regresiĂłn funcional pero no a los modelos que se analizan en la tesis. Las contribuciones en este aspecto son dos: por una parte se proporciona un mĂ©todo de selecciĂłn de variables Lasso para un problema de regresiĂłn con respuesta funcional convirtiendo un problema de optimizaciĂłn funcional a un problema de optimizaciĂłn numĂ©rica vĂa manipulaciones algebraicas y sin necesidad de remuestreo. DespuĂ©s de ejecutar el problema de optimizaciĂłn, como segunda contribuciĂłn se propone un análisis de las soluciones para decidir los regresores que deben ser eliminados. Este segundo análisis se ha denominado The Shaked Lasso porque se basa en alterar un parámetro del proceso de optimizaciĂłn para observar cĂłmo se mueven las soluciones. Respecto al segundo capĂtulo de contribuciones de la tesis, se propone un contraste de hipĂłtesis para testear si un proceso autoregresivo funcional se puede considerar como un camino aleatorio. Hasta lo que nosotros conocemos en la literatura en este campo, es el primer test de este tipo que se propone en la literatura.
Description
Keywords
Functional data analysis, Functional regression, Functional time series, Random walks