E N D
1. 1 Datawarehouse
2. 2 Plan Ce quest le datawarehouse ?
Un modle multidimensionnel
Architecture dun datawarehouse
Implmentation dun datawarehouse
Autres dveloppements de la technologie data cube
3. 3 Ce quest le datawarehouse ? Diffrentes dfinitions pas trs rigoureuses
Une BD daide la dcision qui est maintenue sparment de la base oprationnelle de lorganisation
Un datawarehouse est une collection de donnes concernant un sujet particulier, varie dans le temps, non volatile et o les donnes sont intgres.W. H. Inmon
Datawarehousing:
Le processus qui permet de construire un data warehouse
4. 4 Sujet Organis autour dun sujet bien prcis, ex: client, produit, ventes.
Sintresse la modlisation et lanalyse des donnes pour aider les dcideurs, non pas pour des activits quotidiennes ou traitement transactionnel
Fournit une vue simple et concise concernant un sujet particulier en excluant les donnes qui ne servent pas la prise de dcision
5. 5 Donnes intgres Construit en intgrant plusieurs sources de donnes possiblement htrognes
BDs relationnelles, fichiers plats,
Les techniques dintgration et de nettoyage des donnes sont utilises
Garantir la consistance des conventions de nommage (les attributs Nom et Nom_Famille dans BD1 et BD2 dsignent la mme chose)
structures de codage (lattribut Nom est sur 15 char et 20 char sur BD1 et BD2; NSS est une chane dans BD1 et cest un entier long dans BD2),
domaines des attributs (ex: cm vs pouce), etc.
Cest au moment o les donnes sont copies dans le data warehouse quelles sont traduites
6. 6 Varie dans le temps La porte temporelle des donnes dans un datawarehouse est plus longue que celle des bases oprationnelles
Base oprationnelle: valeur courante des donnes.
Datawarehouse: fournit des infos sous une perspective historique (ex: 5 10 dernires annes)
Dans un datawarehouse, en gnral, chaque donne fait rfrence au temps
Mais dans une base oprationnelle les donnes peuvent ne pas faire rfrence au temps
7. 7 Datawarehouse est Non-Volatile Un support de stockage spar
Les mises jour de la base oprationnelle nont pas lieu au niveau de la datawarehouse
Na pas besoin de modules de gestion de transactions (concurrence, reprise sur panne )
Na besoin que de deux oprations pour accder aux donnes :
Chargement initial des donnes et interrogation (lecture).
8. 8 Datawarehouse vs. SGBD htrognes Traditionnellement, lintgration de BDs htrognes se fait par le biais de:
mediateurs au dessus des BDs htrognes
Approche oriente requte
Quand une requte est pose par un site client, un mta-dictionnaire est utilis pour la traduire en plusieurs requtes appropries chacune des BDs. Le rsultat est lintgration des rponses partielles.
Lexcution des requtes demande donc beaucoup de ressources
Datawarehouse: Approche oriente mise jour
Les infos sont intgres et stockes pour une interrogation directe. Plus efficace en cot dexcution des requtes
9. 9 Datawarehouse vs. BD Oprationnelle OLTP (On-Line Transaction Processing)
Excution en temps rel des transactions, pour l enregistrement des oprations quotidiennes: inventaire, commandes, paye, comptabilit
Par opposition aux traitements en batch
OLAP (On-Line Analytical Processing)
Traitement efficace des requtes danalyse pour la prise de dcision qui sont en gnral assez complexes (bien qua priori, elles peuvent tre ralises par les SGBD classiques)
OLTP vs. OLAP :
Donnes: courantes, dtailles vs. historiques, consolides
Conception : modle ER + application vs. Modle en toile + sujet
Vue : courante, locale vs. volutive, intgre
Modes daccs: mise jour vs. lecture seule mais requtes complexes
10. 10 OLTP vs. OLAP