190 likes | 881 Vues
DATA MART. Los data warehouses están hechos para proporcionar una fuente de datos única para todas las actividades de apoyo para la toma de decisiones.
E N D
DATA MART • Los data warehouses están hechos para proporcionar una fuente de datos única para todas las actividades de apoyo para la toma de decisiones. • Fue evidente que los usuarios a menudo realizaban amplias operaciones de informes y análisis de datos sobre un subconjunto relativamente pequeño de todo el data warehouse. • La ejecución repetida de tales operaciones sobre el mismo subconjunto de todo el almacén no era muy eficiente.
Entre las perdidas inherentes al uso de data marts están la escalabilidad limitada, la duplicación de datos, la inconsistencia de los datos con respecto a otros almacenes de información y la incapacidad para aprovechar las fuentes de datos de la empresa. • El Data mart es un sistema orientado a la consulta, en el que se producen procesos batch de carga de datos (altas) con una frecuencia baja y conocida. • Es consultado mediante herramientas OLAP (On line Analytical Processing - Procesamiento Analítico en Línea) que ofrecen una visión multidimensional de la información. • Sobre estas bases de datos se pueden construir EIS (Executive Information Systems, Sistemas de Información para Directivos) y DSS (Decision Support Systems, Sistemas de Ayuda a la toma de Decisiones).
Conceptos de Data Mart • "un almacén de datos especializado, orientado aún tema, integrado, volátil y variante en el tiempo para apoyar un subconjunto específico de decisiones de administración". • La principal diferencia entre un data mart y un data warehouse es que el data mart es especializado y volátil. • Por especializado queremos decir que contiene datos para dar apoyo (solamente) a un área específica de análisis de negocios; por volátil queremos decir que los usuarios pueden actualizar los datos e incluso, posiblemente, crear nuevos datos (es decir, nuevas tablas) para algún propósito.
Funcionamiento de los Data Marts: • La implementación es muy similar, ya que debe proporcionar las mismas funcionalidades. • Una aplicación corriendo sobre un data mart necesita los mismos recursos que si corriera sobre un data warehouse. • El menor volumen de datos se debe a que no se tienen todos los datos de toda la empresa, pero si se tienen todos los datos de un determinado sector de la empresa, por lo que una consulta sobre dicho sector tarda lo mismo si se hace sobre el data mart que si se hace sobre el data warehouse. • Actualizar el data mart desde el data warehouse cuesta menos (ya que los formatos de los datos son o suelen ser idénticos) que actualizar el data warehouse desde sus fuentes de datos primarias, donde es necesario realizar operaciones de transformación (ver ETL).
Tres enfoques principales para la creación de un data mart: • Los datos pueden ser simplemente extraídos del data warehouse; de hecho, sigue un enfoque de "divide y vencerás" sobre la carga de trabajo general de apoyo para la toma de decisiones, a fin de lograr un mejor rendimiento y escalabilidad. • A pesar del hecho de que el data warehouse pretende proporcionar un "punto de control único", un data mart puede ser creado todavía en forma independiente (es decir, no por medio de la extracción a partir del data warehouse). • Algunas instalaciones han seguido un enfoque de "primero el data mart", donde los data marts son creados conforme van siendo necesarios y el data warehouse general es creado, finalmente, como una consolidación de los diversos data marts.
Una nota sobre el diseño de data marts Una decisión importante que hay que tomar en el diseño de cualquier base de datos de apoyo para la toma de decisiones es la “granularidad” de la misma
Data mart OLAP Se basan en los populares cubos OLAP, que se construyen agregando, según los requisitos de cada área o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional.
Las compañías generalmente almacenan los datos de la empresa en bases de datos relacionales, lo que significa que alguien tiene que extraer, transformar y cargar estos datos en el hipercubo
Ejemplo sencillo El cubo podría adoptar una nueva orientación para que los datos aparezcan ahora en función de los períodos y el tipo de coste.
Data mart OLTP es un tipo de sistemas que facilitan y administran aplicaciones transaccionales, usualmente para entrada de datos y recuperación y procesamiento de transacciones (gestor transaccional)
Ventajas: • Poco volumen de datos • Mayor rapidez de consulta • Consultas SQL y/o MDX sencillas • Validación directa de la información • Facilidad para el historial de los datos
Dependencia de un data mart • Se necesita para un esquema o modelo de datos espacial • Prestaciones • Seguridad • Conveniencia • Demostración sobre el terreno • Política