Publication:
(Batch) Markovian arrival processes: the identifiability issue and other applied aspects

Loading...
Thumbnail Image
Identifiers
Publication date
2015-03
Defense date
2015-03-26
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
This dissertation is mainly motivated by the problem of statistical modeling via a specific point process, namely, the Batch Markovian arrival processes. Point processes arise in a wide range of situations of our daily activities, such as people arriving to a bank, claims of an insurance company or failures in a system. They are defined by the occurrence of an event at a specific time, where the event occurrences may be understood from different perspectives, either by the arrival of a person or group of people in a waiting line, the different claims to the insurance companies or failures occurring in a system. Point processes are defined in terms of one or several stochastic processes which implies more versatility than mere single random variables, for modeling purposes. A traditional assumption when dealing with the analysis of point processes is that the occurrence of events are independent and identically distributed, which considerably simplifies the theoretical calculations and computational complexity, and again because of simplicity, the Poisson process has been widely considered in stochastic modelling. However, the independence and exponentiability assumptions become unrealistic and restrictive in practice. For example, in teletraffic or insurance contexts it is usual to encounter dependence amongst observations, high variability, arrivals occurring in batches, and therefore, there is a need of more realistic models to fit the data. In particular, in this dissertation we investigate new theoretical and applied properties concerning the (batch) Markovian arrival processes, or (B)MAP, which is well known to be a versatile class of point process that allows for dependent and non-exponentially distributed inter-event times as well as correlated batches. They inherit the tractability of the Poisson processes, and turn out suitable models to fit data with statistical features that differ from the classical Poisson assumptions. In addition, in spite of the large amount of works considering the BMAP, still there are a number of open problems which are of interest and which shall be considered in this dissertation. This dissertation is organized as follows. In Chapter 1, we present a brief theoretical background that introduces the most important concepts and properties that are needed to carry out our analyses. We give a theoretical background of point processes and describe them from a probabilistic point of view. We introduce the Markovian point processes and its main properties, and also provide some point process estimation backdrop with a review of recent works. An important problem to consider when the statistical inference for any model is to be developed is the uniqueness of its representation, the identifiability problem. In Chapter 2 we analyze the identifiability of the non-stationary two-state MAP. We prove that, when the sample information is given by the inter-event times, then, the usual parametrization of the process is redundant, that is, the process is nonidentifiable. We present a methodology to build an equivalent non-stationary two-state MAPs from any fixed one. Also, we provide a canonical and unique parametrization of the process so that the redundant versions of the same process can be reduced to its canonical version. In Chapter 3 we study an estimation approach for the parameters of the non-stationary version of the MAP under a specific observed information. The framework to be considered is the modelling of the failures of N electrical components that are identically distributed, but for which it is not reasonable to assume that the operational times related to each component are independent and identically distributed. We propose a moments matching estimation approach to fit the data to the non-stationary two-state MAP. A simulated and a real data set provided by the Spanish electrical group Iberdrola are used to illustrate the approach. Unlike Chapters 2 and 3, which are devoted to the Markovian arrival process, Chapters 4 and 5 focus on its arrivals-in-batches counterpart, the BMAP. The capability of modeling non-exponentially distributed and dependent inter-event times as well as correlated batches makes the BMAP suitable in different real-life settings as teletraffic, queueing theory or actuarial contexts, to name a few. In Chapter 4 we analyze the identifiability issue of the BMAP. Specifically, we explore the identifiability of the stationary two-state BMAP noted as BMAP2(k), where k is the maximum batch arrival size, under the assumptions that both the inter-event times and batches sizes are observed. It is proven that for k ≥ 2 the process cannot be identified. The proof is based on the construction of an equivalent BMAP2(k) to a given one, and on the decomposition of a BMAP2(k) into k BMAP2(2)s. In Chapter 5 we study the auto-correlation functions of the inter-event times and batch sizes of the BMAP. This chapter examines the characterization of both auto-correlation functions for the stationary BMAP2(k), for k ≥ 2, where four behavior patterns are identified for both functions for the BMAP2(2). It is proven that both auto-correlation functions decrease geometrically as the time lag increases. Also, the characterization of the autocorrelation functions has been extended for the general BMAPm(k) case, m ≥ 3. To conclude, Chapter 6 summarizes the most significant contributions of this dissertation, and also give a short description of possible research lines.
Esta tesis está motivada por el problema de modelización estadística mediante un tipo específico de procesos puntuales, los procesos de llegada Markovianos en tandas. Los procesos puntuales surgen en una gran variedad de situaciones de la vida real, como las personas que llegan a un banco, reclamaciones en compañías de seguro o fallos en un sistema. Los procesos puntuales se definen como la ocurrencia de eventos en diferentes instantes temporales, donde las ocurrencias de eventos se pueden entender desde diferentes perspectivas, llegadas de personas o un grupo de personas a una cola, las distintas reclamaciones en una compañía de seguros o los fallos que ocurren en un sistema. Los procesos puntuales se definen en términos de uno o varios procesos estocásticos lo que implica más versatilidad, en términos de modelización, que la que se obtiene mediante variables aleatorias que no consideren la dimensión temporal. Una suposición tradicional en la literatura al estudiar y analizar procesos puntuales es que los tiempos entre la ocurrencia de eventos son independientes e idénticamente distribuidos, lo que simplifica considerablemente los cálculos teóricos y la complejidad computacional. Adicionalmente, por simplicidad, el proceso de Poisson ha sido ampliamente considerado en modelización estocástica. Sin embargo, las suposiciones de independencia y exponenciabilidad son poco realistas en la práctica. Por ejemplo, en el contexto teletráfico o de seguros es usual encontrar dependencia entre las observaciones, alta variabilidad, llegadas que ocurren en tandas, por lo que hay una necesidad de ajustar los datos a modelos más reales. En particular, en esta tesis investigamos nuevas propiedades teóricas y aplicadas sobre los procesos de llegada Markovianos (en tanda), denotados (B)MAP, que son conocidos por ser procesos puntuales versátiles que permiten la dependencia y no-exponenciabilidad de los tiempos entre eventos, así como la correlación entre las tandas. Ya que heredan la manejabilidad de los procesos de Poisson, son procesos adecuados para ajustar datos con características estadísticas que difieren de los supuestos clásicos de Poisson. Además, a pesar de la gran cantidad de trabajos que consideran los BMAP, todavía hay una serie de problemas abiertos que son de interés y que serán considerados en esta tesis. La estructura de esta tesis es la siguiente. En el Capítulo 1, se presenta una breve revisión teórica que introduce las definiciones y propiedades más importantes necesarias para el desarrollo de nuestros análisis. Se definen los procesos puntuales y se describen desde un punto de vista probabilístico. Se introducen los procesos puntuales Markovianos y sus propiedades principales, además se proporciona una revisión de la literatura sobre la estimación de los procesos puntuales. Un problema importante a considerar cuando se quieren desarrollar métodos de inferencia sobre cualquier modelo es la unicidad de su parametrización, o alternativamente, el problema de identificabilidad. En el Capítulo 2 estudiamos el problema de identificabilidad del MAP no estacionario con dos estados. Se demuestra que, cuando la información muestral está dada por los tiempos entre eventos, entonces, la parametrización usual del proceso es redundante, esto es, el proceso es no-identificable. Se presenta un procedimiento para construir un MAP no estacionario con dos estados equivalente a uno fijo. Además, se proporciona una parametrización canónica y única del proceso, de manera que las versiones redundantes o equivalentes de un mismo proceso se pueden reducir a su versión canónica. En el Capítulo 3 se estudia un método de estimación para los parámetros del MAP no estacionario con dos estados. El esquema que se considerará es la modelización de los fallos de N componentes eléctricos que son idénticamente distribuidos, pero que no es razonable considerar que los tiempos operacionales asociados a cada componente son independientes ni idénticamente distribuidos. Se propone un método de igualdad de momentos para ajustar datos a un MAP no estacionarios con dos estados. Se presenta un ejemplo simulado y un ejemplo con datos reales proporcionados por la compañía eléctrica Iberdrola para ilustrar la metodología propuesta. A diferencia de los capítulos 2 y 3, que están dedicados a los procesos de llegada Markovianos, los capítulos 4 y 5 se centran en su generalización para considerar llegadas en tandas, el BMAP. La capacidad de modelar tiempos entre eventos dependientes y no-exponenciales, así como llegadas en tandas correladas, hace que los BMAP sean modelos apropiados en problemas de la vida real, como en contextos teletráficos, de teoría de colas o actuariales, entre otros. En el Capítulo 4 se explora la identificabilidad para el BMAP estacionario de 2 estados, BMAP2(k), donde k es el tamaño máximo de las tandas, bajo la suposición de que los tiempos entre eventos y los tamaños de las tandas son los datos observados. Se demuestra que para k ≥ 2 el proceso no es único. La demostración se basa en la construcción de un BMAP2(k) equivalente a uno fijo, y en la descomposición de un BMAP2(k) en k BMAP2(2)s. En el Capítulo 5 se estudia las funciones de autocorrelación para los tiempos entre-eventos y las llegadas en tanda del BMAP. Además, también se examina la caracterización de ambas funciones de autocorrelación para el BMAP2(k), k ≥ 2, estacionario, donde se identifican cuatro patrones para el BMAP2(2). Se demuestra que ambas funciones de autocorrelación decrecen geométricamente. Finalmente, se extiende la caracterización de las funciones de autocorrelación para el caso general BMAPm(k), m ≥ 3. Finalmente, en el Capítulo 6 se resumen las contribuciones más importantes de esta tesis y futuras líneas de investigación.
Description
Mención Internacional en el título de doctor
Keywords
Batch Markovian arrival processes, Point processes, BMAP
Bibliographic citation
Collections