Publication:
Modelling approaches via (batch) Markov modulated poisson processes

Loading...
Thumbnail Image
Identifiers
Publication date
2020-06
Defense date
2020-07-23
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
This dissertation is mainly motivated by the problem of statistical modeling via a specific point process, namely, the (Batch) Markov Modulated Poisson process. Point processes arise in a wide range of situations in physics, biology, engineering, or economics. In general, the occurrence of events is defined depending on the context, but in many areas are defined by the occurrence of an event at a specific time. Sometimes, in order to simplify the models and obtain closed form expressions for the quantities of interest, the exponentiality and/or independence of the inter-event times is assumed. However, the independence and exponentiability assumptions become unrealistic and restrictive in practice, and therefore, there is a need of more realistic models to fit the data. The Batch Markov Modulated Poisson Process (BMMPP) is a subclass of the versatile Batch Markovian Arrival process (BMAP) which has been widely used for the modeling of dependent and correlated simultaneous events (as arrivals, failures or risk events). Both BMMPP and BMAP allow for dependent and non-exponentially distributed inter-event times as well as for correlated batches, but at the same time they inherit the tractability of the Poisson processes. Therefore, they turn out suitable models to fit data with statistical features that differ form the classical Poisson assumptions. In spite of the large amount of works considering the BMAP subclasses of processes, still there are a number of open problems of interest that will be considered in this dissertation, which is organized as follows. In Chapter 1, a brief theoretical background that introduces the most important concepts and properties that are needed to carry out our analyses is presented. The markovian point processes and their main properties are introduced. In Chapter 2 the identifiability of the stationary BMMPPm(K) is proven, where K is the maximum batch size and m is the number of states of the underlying Markov chain. This is a powerful result for inferential issues. On the other hand, some findings related to the correlation and autocorrelation structures are provided. Chapter 3 focuses on exploring the possibilities of the BMMPP for the modeling of real phenomena involving point processes with group arrivals. The first result in this sense is the characterization of the BMMPP2(K) by a set of moments related to the inter-event time and batch size distributions. This characterization leads to a sequential fitting approach via a moments matching method. The performance of the novel fitting approach is illustrated on both simulated and a real teletrafic data set, and compared to that of the EM algorithm. In addition, as an extension of the inference approach, the queue length distributions at departures in the queueing system BMMPP=M=1 is also estimated. Unlike Chapters 2 and 3, which are devoted to the Batch Markov Modulated Poisson Process, Chapter 4 presents an extension to the two-dimensional case of the Markov modulated Poisson process (MMPP), motivated by real failure data in a two-dimensional context. The one-dimensional MMPP has been proposed for the modeling of dependent and non-exponential interevent times (in contexts as queuing, risk or reliability, among others). The novel two-dimensional MMPP allows for dependence among the two sequences of inter-event times, while at the same time preserves the MMPP properties marginally. Such generalization is based on the Marshall-Olkin exponential distribution. Inference is undertaken for the new process through a method combining a matching moments approach and an ABC algorithm. The performance of the method is shown on simulated and real datasets representing failures of a public transport company. To conclude, Chapter 5 summarizes the most significant contributions of this dissertation, and also gives a short description of possible research lines.
Esta tesis está principalmente motivada por el problema de la modelización estadística mediante un tipo específico de procesos puntuales: el (Batch) Markov Modulated Poisson process. Los procesos puntuales aparecen en una amplia variedad de situaciones en la física, la biología, la ingeniería o la economía. En general, la ocurrencia de eventos se define en relación con el contexto, pero en muchas áreas están vinculados a la ocurrencia de un evento en un momento específico. En la mayoría de las ocasiones con el objetivo de simplificar los modelos y obtener expresiones cerradas para las cantidades de interés, se asume que los tiempos entre eventos son independientes y exponencialmente distribuidos. Sin embargo, las suposiciones de independencia y exponencialidad pueden ser poco realistas y restrictivas en la práctica, y por consiguiente, se necesitan modelos más alineados con la realidad para ajustar los datos. Los Batch Markov Modulated Poisson Processes (BMMPPs) son una subclase de los Batch Markovian Arrival processes (BMAPs), los cuales han sido ampliamente usados para la modelización de eventos correlados (tales como llegadas, fallos o eventos de riesgo). Tanto los BMMPPs como los BMAPs permiten la dependencia y no exponencialidad de los tiempos entre eventos así como las llegadas en grupo correladas, pero al mismo tiempo heredan la tratabilidad de los procesos de Poisson. Por lo tanto, resultan ser modelos adecuados para ajustar los datos con características estadísticas que difieren de los supuestos clásicos de los procesos de Poisson. A pesar de la gran cantidad de trabajos considerando las subclases de procesos BMAP, persisten varios problemas abiertos que son de interés y que serían considerados en esta tesis, la cual se organiza de la siguiente manera. En el Capítulo 1, se presenta un breve recorrido teórico y metodológico que introduce los conceptos y propiedades más importantes que se necesitan para desarrollar las principales aportaciones de la tesis. Además se introducen los procesos puntuales Markovianos y sus principales propiedades. En el Capítulo 2 se prueba la identifiabilidad del BMMPPm(K) estacionario, donde K es el tamaño máximo del grupo de llegada y m es el número de estados de la cadena de Markov subyacente. Este es un resultado deseable de cara a la inferencia. Además se prueban algunas propiedades nuevas relacionadas con las estructuras de correlación y autocorrelación. El Capítulo 3 se centra en la exploración de las posibilidades del BMMPP para la modelización de fenómenos reales que involucran procesos puntuales con llegadas en grupo. El primer resultado en este sentido es la caracterización del BMMPP2(K) por un conjunto de momentos relacionados con los tiempos entre llegadas y la distribución del tamaño de los grupos. Esta caracterización lleva a un enfoque de ajuste secuencial a través de un método de ajuste por momentos. El grado de ajuste y la potencia de este nuevo enfoque se ilustran tanto con datos simulados como con una base de datos reales de teletráfico y se compara con el algoritmo EM. Ademas, como una extensión del enfoque de inferencia, se estiman las distribuciones de la longitud de la cola en el momento en que terminan los servicios en un sistema de cola BMMPP=M=1. A diferencia de los Capítulos 2 y 3, que se dedican al Batch Markov Modulated Poisson Process, el Capítulo 4 presenta una extensión al caso bidimensional del Markov Modulated Poisson process (MMPP), motivado por datos reales de fallos en un contexto bidimensional. El modelo unidimensional MMPP se ha propuesto para la modelización de tiempos entre eventos dependientes y no exponenciales (en contextos como la teoría de colas, el riesgo o la fiabilidad, entre otros). El nuevo MMPP bidimensional permite la dependencia entre las dos secuencias de tiempos entre eventos, mientras conserva las propiedades del MMPP marginalmente. Esta generalización se basa en la distribución exponencial bivariante Marshall-Olkin. Además se lleva a cabo la inferencia para el nuevo proceso a través de un método que combina el método de los momentos con el algoritmo ABC. Los resultados del método propuesto se muestran tanto para datos simulados como para una base de datos reales que representa los fallos de una compañía de transporte público de trenes. Para concluir, el Capítulo 5 resume las contribuciones más significativas de esta tesis, y contiene además una breve descripción de posibles líneas de investigación.
Description
Keywords
Statistical modeling, Batch Markov Modulated poisson process
Bibliographic citation
Collections