480 likes | 763 Vues
Intégration de l'information géographique dans les entrepôts de données et l'analyse en ligne : de la modélisation à la visualisation. Sandro Bimonte Directeurs de thèse : Anne Tchounikine, Robert Laurini LIRIS, INSA de Lyon. Introduction. Plan. Contexte
E N D
Intégration de l'information géographique dans les entrepôts de données et l'analyse en ligne : de la modélisation à la visualisation Sandro Bimonte Directeurs de thèse : Anne Tchounikine, Robert Laurini LIRIS, INSA de Lyon
Plan • Contexte • Information géographique et analyse spatiale • Modèles multidimensionnels et analyse en ligne • OLAP Spatial • Contributions • OLAP Géographique • GeoCube: Un modèle conceptuel pour l’OLAP Géographique • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives
Information géographique et analyse spatiale Contexte • « La représentation d’un objet ou d’un phénomène localisé dans l’espace » (Degrene et Salgé, 1997) • Multi-facettes • Spatiale : position, forme • Sémantique : propriétés, relations • Systèmes d'Informations Géographiques • Mémorisation • Visualisation • Analyse • Itérative • Flexible
Modèles multidimensionnels et analyse en ligne Contexte • « Une collection de données, intégrées, non volatiles et historisées pour la prise de décision »(Inmon, 1996) • Hypercube • Fait, mesures et dimensions • Agrégation (SUM, MIN, MAX, AVG, COUNT) • L'analyse OLAP • Forage, coupe, pivot, etc. • Interactive • Chemins et donnéesd’analyse définis a priori • Systèmes d'Informations Décisionnels
Giorgio de chirico, Les muses inquiétantes • Contexte • Information géographique et analyse spatiale • Modèles multidimensionnels et analyse en ligne • OLAP Spatial • Contributions • OLAP Géographique • GeoCube: Un modèle conceptuel pour l’OLAP Géographique • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives
OLAP Spatial : Définition Contexte OLAP Spatial • « Une plate-forme visuelle spécialement conçue pour supporter l’analyse et l’exploration spatio-temporelles rapides et faciles des données multidimensionnelles composées de plusieurs niveaux d’agrégation à l’aide d’affichages cartographiques aussi bien qu’à l’aide de tableaux et diagrammes statistiques » (Bédard, 1997) • La représentation cartographique permet de • Visualiser la distribution spatiale des faits • Visualiser les relations [spatiales] entre les faits et les dimensions • Visualiser les faits à différentes granularités spatiales
(Malinowski et Zimányi, 2004) Concepts principaux Contexte OLAP Spatial • Dimension spatiale • Dimension comportant des attributs spatiaux(Bédard et al., 2001), (Malinowski et Zimányi, 2005), (Fidalgo et al. 2004) • Opérateurs spatio-multidimensionnels • Naviguer dans la dimension spatiale (Rivest et al., 2005) … • Couper l’hypercube spatial (Scotch et Parmanto, 2005), (Matias et Moura-Pires, 2007) …
(Malinowski et Zimányi, 2004) Concepts principaux Contexte OLAP Spatial • Mesure Spatiale • Liste d'objets spatiaux (Stefanovic et al., 2000), (Rivest et al., 2001), (Malinowski et Zimányi, 2004) • Résultat d'opérateurs spatiaux (Rivest et al., 2001), (Malinowski et Zimányi, 2004) • Agrégation Spatiale • Extension des fonctions d’agrégation OLAP (Shekar et al., 2001)…
Outils SOLAP Contexte OLAP Spatial • Types de solutions SOLAP(Rivest et al., 2005) • OLAP-SIG Intégrées, OLAP dominantes, SIG dominantes • Repenser l’architecture des systèmes décisionnels • Client SOLAP • Synchronisation des composantes tabulaire, graphique et cartographique • Dimension spatiale : carte • Mesures : variables visuelles et/ou affichages graphiques Scotch, et al. 05 Bédard, et al. 05
Les modèles SOLAP sont-ils l’intégration de l’information géographique et des modèles multidimensionnels ? Contexte OLAP Spatial Bilan Objectifs • Prise en compte des composantes • Spatiale • Sémantique
L’analyse SOLAP est-elle l’intégration de l’analyse OLAP et spatiale ? Contexte OLAP Spatial Bilan Objectifs Introduire de la dynamique
Vincent Van Gogh, Les Champs de blé aux corbeaux • Contexte • Contributions • OLAP Géographique • Dimension Géographique • Mesure Géographique • Opérateurs multidimensionnels Géographiques • GeoCube: Un modèle conceptuel pour l’OLAP Géographique • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives
Cas d’étude Contributions OLAP Géographique • CORILA • Organisation pour la sauvegarde environnementale, architecturale et économique de la lagune de Venise • Fournir aux spécialistes environnementaux un système pour l’analyse spatio-multidimensionnelle de données environnementales • Données • mesures de pollution • date • polluants • unités lagunaires
Unité Objet Géographique Contributions OLAP Géographique • Une entité du monde réel • Des attributs descriptifs et un attribut spatial • Donnée de l'univers d'analyse
Dimension Géographique Contributions OLAP Géographique • Une dimension est dite «géographique» si les membres d’au moins un niveau sont des objets géographiques • Types de hiérarchie
Dimension Géographique Contributions OLAP Géographique • Une dimension est dite «géographique» si les membres d’au moins un niveau sont des objets géographiques • Types de hiérarchie • Descriptive
Zone Unit Dimension Géographique Contributions OLAP Géographique • Une dimension est dite «géographique» si les membres d’au moins un niveau sont des objets géographiques • Types de hiérarchie • Descriptive • Spatiale
Dimension Géographique Contributions OLAP Géographique • Une dimension est dite «géographique» si les membres d’au moins un niveau sont des objets géographiques • Types de hiérarchie • Descriptive • Spatial • Généralisation
Mesure Géographique Contributions OLAP Géographique • Une « mesure géographique » est un objet géographique qui peut appartenir à un ou plusieurs schémas hiérarchiques • Une fonction d’agrégation par attribut • Prise en compte de la hiérarchie
Opérateurs Multidimensionnels Géographiques Contributions OLAP Géographique • Navigation • Forage, coupe • Navigation dans la hiérarchie de la mesure • Modification • Permutation mesure/dimension • Création dynamique de nouveaux membres
Edvard Munch, Le Cri • Contexte • Contributions • OLAP Géographique • GeoCube : Un modèle conceptuel pour l’OLAP Géographique • Modèle de données : Entité, Hiérarchie, Cube de Base • Modèle d’interrogation : Mode d’Agrégation, Vue • Algèbre : Opérateurs • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives
Entité et Hiérarchie GeoCube Modèle de données • Une Entité représente les mesures et/ou les membres de dimensions • Sunit = name_unit, geometry, salinity, listofplants, type, farea • t1 = ’Canal Fondello’, P1, 24, list(‘Spartima Marittima’, ‘Fullica’), ‘Commercial’, 245100 • Les Entités sont organisées en hiérarchies • Hlagoon_spatial= Llagoon_spatial, Sunit, Sall_unit, lagoon_spatialoù Llagoon_spatial = {Szone} et (Sunitlagoon_spatial Szone) et (Szonelagoon_spatial Sall_unit) Un Schéma d’Entité Se est un tuple a1, …an, [F] où i [1,…n], ai est un Attribut défini sur un domaine dom(ai) et F, s’il existe, est un tuple f1,f2,…fm où l [1,…m], fl est une fonction définie sur un sous-ensemble des attributs a1, …an Un Schéma de Hiérarchie est un tuple Hh = L h, h, h, h où : • Lh est un ensemble de Schémas d’Entité, • h et h sont deux Schémas d’Entité et h contient une seule instance (‘all’), • h est un ordre partiel défini sur l’ensemble des niveaux de la hiérarchie L hhh et h forme un treillis où h et h sont respectivement l’extrémité inférieure et l’extrémité supérieure de l’ordre
Entité et Hiérarchie : propriétés GeoCube Modèle de données • Entité • Utilisée comme mesure et/ou membre de dimension • Attributs et attributs dérivés • Hiérarchie d'entités • Non-stricte • Non-couvrante • Représentation graphique Schéma de Hiérarchie Instance de Hiérarchie
Cube de Base GeoCube Modèle de données • Table de faits où toutes les dimensions sont aux niveaux les plus détaillés • BCcorila = Hpollutants, Htime, Hlagoon_spatial, Hrate, où : I(Spollutant)I(Sday)I(Sunit)I(Srate5) • Un Schéma de Cube de Base BCbc est un tuple H1,…Hm+1, où : • i [1,…m+1], Hi est un Schéma de Hiérarchie et toutes les hiérarchies Hi sont disjointes • est une fonction booléenne définie sur I(1)...I(m+1) ( est définie sur les niveaux bottom des hiérarchies H1,…Hm+1) Instance de BCcorila
Cube de Base : propriétés GeoCube Modèle de données • Représentation symétrique des mesures et des dimensions • « Unités polluées par polluant, jour et par degrés de pollution » • « Polluants présents par unité, jour et par degrés de pollution » • Relations n-n entre faits et dimensions • Mazzorbo polluée par du Méthane et du Sulfure à hauteur de 30-34 mg/l • Mesures multi-valuées • Mazzorbo et Murano sont polluées par du Zinc à hauteur de 45-49 mg/l
Mode d’Agrégation GeoCube Modèle d’Interrogation Un Mode d’Agrégation k est un tuple Sa, Sb, F où : • Sa est un Schéma d’Entité a1,…am, [Fa ] • Sb est un Schéma d’Entité b1,…bp, [Fb ] • F est ensemble de p fonctions ad hoc d’agrégation i L’agrégation de n instances t1,… tn de Sa en utilisant un Mode d’Agrégation k = Sa, Sb, F est une instance de tb Sb tb = val(b1),…val(bp),val(d1),…val(dm) tel que : • i [1,…l], val(di) = fi(val(br),…val(bk)) où r, k [1,…m] si Fb existe • g
Mode d’Agrégation : propriétés GeoCube Modèle d’Intérrogation • Une fonction d’agrégation pour chaque attribut de la mesure agrégée • Les fonctions d’agrégation sont définies par l’utilisateur • Les mesures agrégées sont éventuellement différentes des mesures détaillées • Nombre d'attributs différents • Types des attributs différents
Vue GeoCube Modèle d’Intérrogation • Établit quelle Entité est utilisée comme mesure et comment l’agréger • Le Schéma de Vue représente le schéma d’un cuboïde • L’Instance de Vue représente les données du cuboïde
Vue GeoCube Modèle d’Intérrogation • Établit quelle Entité est utilisée comme mesure et comment l’agréger • Le Schéma de Vue représente le schéma d’un cuboïde • L’Instance de Vue représente les données du cuboïde
Vue GeoCube Modèle d’Intérrogation • Vcorila-unit-month=BCcorila,Spollutant,Smonth,Srate5, fusion-unit, • « Unités agrégées par polluant, valeur de pollution et mois » Un Schéma de Vue Vv est un tuple BCbc, L, k, où : • BCbc = Hb1,…Hbm+1, est un Schéma de Cube de Base, • L est un tuple de Schémas d’Entité SL1,…SLm tel que • i, j [1,…m], l et p [1,…m], tels que SLi L(Hbl), SLj L(Hbp) et l p • k est un Mode d’Agrégation Sf, Saf, F tel que • h {Hb1,…Hbm+1} tel que Sf = h et i [1,…m], Sf L(H(BCbc , SLi)) • est une fonction booléenne définie sur I(SL1)…I(SLm)I(Saf)
Algèbre GeoCube Algèbre • Modèle • Soit Vv = BCbc, L, k, alors Op (Vv) [paramètres] = V’v = BC’bc, L’, ’k, ’ où ’ est calculée en utilisant l’algorithme de l’opérateur
Roll-Up () GeoCube Algèbre • Monter dans une hiérarchie et agréger les mesures • Dimension "classique" et mesure géographique • "Unités agrégées de la lagune par polluant, degrés de pollution et par mois" • (Vcorila-unit)[Smonth] • Dimension géographique et mesure complexe • "Mesure pollution par zones, mois, et polluants" • (Vcorila-pollutant)[Smonth] • Sans comptage multiple
Classify et Specialize GeoCube Algèbre • Naviguer dans la hiérarchie de la mesure • Classify • Toutes les descendants dans la table des faits • « Zones dont toutes les unités sont polluées, pour chaque jour et pour chaque polluant ? » • w(Vcorila-unit)[Szone,fusion-zone] • Specialize • Au moins un descendant dans la table des faits • « Zones dont au moins une unité est polluée, pour chaque jour et pour chaque polluant ? » • v(Vcorila-unit)[Szone,fusion-zone]
Autres opérateurs…. GeoCube Algèbre • Slice () coupe l’hypercube • à l'aide de prédicats spatiaux ou alphanumériques • membres des dimensions ou mesures • Dice (h) élimine une dimension • Permute (P) change le sujet d'analyse • Le niveau le plus détaillé de la hiérarchie devient la nouvelle mesure • La hiérarchie associée à la mesure est utilisée comme axe d’analyse • OLAP-Buffer (b) créeunnouveau membre géographique • A l'aide d'un opérateur de transformation spatiale • Recalcul les valeurs des mesures associées
Requêtes complexes GeoCube Algèbre • Agrégation sur cousins : Slice + RollUp • Agréger les mesures à travers le changement de granularité de la mesure : Specialize + Permute + Classify/Specialize
Fernandez Arman, Tubes Rouges • Contexte • Contributions • OLAP Géographique • GeoCube: Un modèle conceptuel pour l’OLAP Géographique • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives
GeWOlap Contributions GeWOlap • Un système pour l’OLAP Géographique • OLAP-SIG intégré • Interface web synchronisée • Fondé sur GeoCube • Mesures géographiques • Dimensions géographiques • Opérateurs multidimensionnels géographiques • Forage • Coupe • Modification Architécture
Client GeWOlap Contributions GeWOlap
Dimension Géographique Contributions GeWOlap GeWOlap Drill-downPosition
Mesure Géographique Contributions GeWOlap
Autres opérateurs... Slice predicate Overlay Buffer
Pablo Picasso, L’usine de Horta de Hebro • Contexte • Analiyse en ligne • Analisy Multiidmensionnelle • OLAP Spatial • Contributions • OLAP Géographique • GeoCube: Un modèle conceptuel pour l’OLAP Géographique • GeWOlap: Un solution web pour l’OLAP Géographique • Conclusion et perspectives
Conclusion • Un nouveau paradigme d’analyse multidimensionnel • Un modèle conceptuel multidimensionnel et une algèbre • Un système de navigation dans un hypercube géographique • Intégration de la composante sémantique de l’information géographique • Intégration de la flexibilité de l’analyse spatiale • Contrôle de la sématique de l’agrégation • Politiques de pre-agrégation géographique • Modèle complexe pour le recalcul des mesures
Perspectives • GeoCube • Additivité des mesures géographiques • Hiérarchies de généralisation • Visualisation • Géovisualisation • Règles de sémiologie • GeOlaPivot Table • Ouvertures thématiques • Composante temporelle de l’information géographique • OLAP Géographique Mobile