1 / 50

Datawarehouse

2. Plan. Ce qu'est le datawarehouse ? Un mod

tavon
Télécharger la présentation

Datawarehouse

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. 1 Datawarehouse

    2. 2 Plan Ce quest le datawarehouse ? Un modle multidimensionnel Architecture dun datawarehouse Implmentation dun datawarehouse Autres dveloppements de la technologie data cube

    3. 3 Ce quest le datawarehouse ? Diffrentes dfinitions pas trs rigoureuses Une BD daide la dcision qui est maintenue sparment de la base oprationnelle de lorganisation Un datawarehouse est une collection de donnes concernant un sujet particulier, varie dans le temps, non volatile et o les donnes sont intgres.W. H. Inmon Datawarehousing: Le processus qui permet de construire un data warehouse

    4. 4 Sujet Organis autour dun sujet bien prcis, ex: client, produit, ventes. Sintresse la modlisation et lanalyse des donnes pour aider les dcideurs, non pas pour des activits quotidiennes ou traitement transactionnel Fournit une vue simple et concise concernant un sujet particulier en excluant les donnes qui ne servent pas la prise de dcision

    5. 5 Donnes intgres Construit en intgrant plusieurs sources de donnes possiblement htrognes BDs relationnelles, fichiers plats, Les techniques dintgration et de nettoyage des donnes sont utilises Garantir la consistance des conventions de nommage (les attributs Nom et Nom_Famille dans BD1 et BD2 dsignent la mme chose) structures de codage (lattribut Nom est sur 15 char et 20 char sur BD1 et BD2; NSS est une chane dans BD1 et cest un entier long dans BD2), domaines des attributs (ex: cm vs pouce), etc. Cest au moment o les donnes sont copies dans le data warehouse quelles sont traduites

    6. 6 Varie dans le temps La porte temporelle des donnes dans un datawarehouse est plus longue que celle des bases oprationnelles Base oprationnelle: valeur courante des donnes. Datawarehouse: fournit des infos sous une perspective historique (ex: 5 10 dernires annes) Dans un datawarehouse, en gnral, chaque donne fait rfrence au temps Mais dans une base oprationnelle les donnes peuvent ne pas faire rfrence au temps

    7. 7 Datawarehouse est Non-Volatile Un support de stockage spar Les mises jour de la base oprationnelle nont pas lieu au niveau de la datawarehouse Na pas besoin de modules de gestion de transactions (concurrence, reprise sur panne ) Na besoin que de deux oprations pour accder aux donnes : Chargement initial des donnes et interrogation (lecture).

    8. 8 Datawarehouse vs. SGBD htrognes Traditionnellement, lintgration de BDs htrognes se fait par le biais de: mediateurs au dessus des BDs htrognes Approche oriente requte Quand une requte est pose par un site client, un mta-dictionnaire est utilis pour la traduire en plusieurs requtes appropries chacune des BDs. Le rsultat est lintgration des rponses partielles. Lexcution des requtes demande donc beaucoup de ressources Datawarehouse: Approche oriente mise jour Les infos sont intgres et stockes pour une interrogation directe. Plus efficace en cot dexcution des requtes

    9. 9 Datawarehouse vs. BD Oprationnelle OLTP (On-Line Transaction Processing) Excution en temps rel des transactions, pour l enregistrement des oprations quotidiennes: inventaire, commandes, paye, comptabilit Par opposition aux traitements en batch OLAP (On-Line Analytical Processing) Traitement efficace des requtes danalyse pour la prise de dcision qui sont en gnral assez complexes (bien qua priori, elles peuvent tre ralises par les SGBD classiques) OLTP vs. OLAP : Donnes: courantes, dtailles vs. historiques, consolides Conception : modle ER + application vs. Modle en toile + sujet Vue : courante, locale vs. volutive, intgre Modes daccs: mise jour vs. lecture seule mais requtes complexes

    10. 10 OLTP vs. OLAP

More Related