Data Warehousse : marco de calidad

Repositorio e-Archivo

Mostrar el registro sencillo del ítem

dc.contributor.advisor García Carmona, Antonio
dc.contributor.author Martín Gutiérrez, Pablo
dc.date.accessioned 2013-02-20T16:39:21Z
dc.date.available 2013-02-20T16:39:21Z
dc.date.issued 2012
dc.date.submitted 2012-09-27
dc.identifier.uri http://hdl.handle.net/10016/16343
dc.description.abstract “La memoria propone una serie de guías de actuación para abordar con garantías de éxito el desarrollo de sistemas que incluyan un almacén de datos central o Data warehouse”. Con la memoria nos centramos en el desarrollo teórico del ámbito que rodea al Data Warehouse y sus relaciones con el resto de componentes que forman parte de un sistema de Business Intelligence. Para poder conseguir las guías de actuación nos basamos en los estándares, normas de calidad o guías de buenas prácticas punteros de la actualidad. El principal punto productivo de la memoria es que se propone un marco de calidad adaptado a las necesidades que un Data Warehouse necesita disponer para que pueda ser desarrollado con las mayores garantías de éxito posibles. Se ha dividido la estructura del documento en cuatro bloques. 1. Con el primer bloque del texto hacemos un resumen del conocimiento que existe sobre soluciones de Business Intelligence centrándonos en primera instancia en qué son para llegar al detalle de su componente más crítico, el Data Warehouse. Se hace especial énfasis en conocer qué es un Data Warehouse, cómo se crea y mantiene y cómo puede explotarse para saber cómo adaptar los puntos fuertes de otros marcos de calidad para nuestros objetivos. Por ello, seguidamente pasamos a explicar el contexto que rodea a los Data Warehouse para saber la forma en la que se desarrollan y encajan sus componentes. Veremos un repaso histórico de cómo han ido evolucionando las soluciones que incorporan Data Warehouse para conocer a partir de ahí las metodologías más importantes que se han desarrollado. Las metodologías más importantes giran en torno a las filosofías de Kimball e Inmon cuyos enfoques son totalmente opuestos, ya que la de Kimball (o Bottom-Up) se centra en el detalle y construye la solución desde lo específico a lo genérico y la de Inmon (Top-Down) parte de construir la solución desde lo genérico para a partir de ahí propagar la solución detallada. 2. Dado que nos centramos en crear un marco de calidad, con el segundo bloque de la memoria hacemos un repaso de los estándares, normas de calidad y guías de buenas prácticas que podremos aplicar a través de un estudio sobre el estado del arte actual e identificando los puntos más adecuados para nuestras guidelines. No solo nos centraremos en la calidad de los datos sino que también haremos un estudio de la calidad de los procesos, desde la implementación del propio DW hasta su explotación, gestión del proyecto de desarrollo etc. Por ello el segundo bloque tiene dos divisiones claras y diferenciadas, la centrada en la gestión y los procesos y la centrada en el dato y sus características. 3. Con el tercer bloque (y objetivo de la memoria) podemos ver el resultado depurado del resto de la memoria ya que obtenemos las directrices que nos sirven de punto de partida para producir DW de calidad que sean fiables para usar en soluciones de BI. 4. No se quería formar un documento puramente teórico, por lo que en la cuarta parte de la memoria nos centramos en el uso de dos herramientas de la familia Microsoft que nos permiten acercar las guidelines al proceso crucial de creación de un DW, el proceso de Extracción, Transformación y Carga de datos (ETL) de los sistemas origen en la base de datos destino que forma el propio DW.Las herramientas son Biztalk Server 2010 para solucionar problemas de interoperabilidad y asegurar que la tarea de Extracción se realice sin problemas y la segunda será SQL Server Integration Services, que propone muchas facilidades para completar el ETL con garantías. ------------------------------------------------------------------------------------------"The document proposes an action guide for dealing with guarantees of success developing systems that include a Data Warehouse."With memory we focus on the theoretical development of the area surrounding the Data Warehouse and its relations with the other components that are part of a business intelligence system. For guidelines, we rely on quality standards and best practice guidelines pointers today. The added value of the document as a framework adapted to the needs of a data warehouse needs to have in order to be developed with greater guarantees of success possible. Structure has been divided into four blocks of the document. 1) The first block of text is a summary of existing knowledge on Business Intelligence solutions. We focus primarily on what are BI solutions to reach the detail of your most critical component, the Data Warehouse. We focus with a special interest in knowing what a Data Warehouse is, how it is created and maintained and how it can be exploited. Paragraph is important to know how to adapt the strengths of other quality frameworks for our purposes. Therefore, we will explain below the context around the data warehouse to know the manner in which they develop and fit components. We will see a historical review of how the solutions have evolved to incorporate Data Warehouse to know from there the most important methodologies that have been developed. The most important methods revolve around the Inmon and Kimball philosophies whose approaches are opposites, as Kimball (or Bottom-Up) focuses on the detail and build the solution from the specific to the generic and the Inmon (Top-Down) part of building the solution from the generic to propagate from there detailed solution. 2) As we focus on building a quality framework, with the second block of memory we review quality standards and best practice guidelines that can be applied through a study on the state of the art and identifying the most suitable to our guidelines. We will focus on both the quality of data and the quality of the process, since the implementation of the DW itself to exploitation, development project management etc. Thus the second block has two clear and distinct divisions, focused on managing the processes and the data-based and property. 3) The third block (and objective memory) shows the result of the rest of the memory and we get the guidelines that serve as a starting point for producing quality DW reliable for use in BI solutions. 4) We want to provide practical content to memory so in the fourth block, we focus on the use of two Microsoft tools that allow us to bring the guidelines to the process of creating a DW, the process of extraction, transformation and loading of data (ETL) from the source system to the target database that is itself DW. Tools are Biztalk Server 2010 to solve interoperability problems and ensure that the task of extraction goes smoothly and the second is SQL Server Integration Services, which offers many facilities to complete the ETL with guarantees.
dc.format.mimetype application/pdf
dc.format.mimetype application/pdf
dc.language.iso spa
dc.rights Atribución-NoComercial-SinDerivadas 3.0 España
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subject.other Ingeniería del conocimiento
dc.subject.other Bases de datos
dc.title Data Warehousse : marco de calidad
dc.type bachelorThesis
dc.subject.eciencia Informática
dc.rights.accessRights openAccess
dc.description.degree Ingeniería Técnica en Informática de Gestión
dc.contributor.departamento Universidad Carlos III de Madrid. Departamento de Informática
 Find Full text

Ficheros en el ítem

*Click en la imagen del fichero para previsualizar.(Los elementos embargados carecen de esta funcionalidad)


El ítem tiene asociada la siguiente licencia:

Este ítem aparece en la(s) siguiente(s) colección(es)

Mostrar el registro sencillo del ítem