1 / 16

Andmeladu ja Mitmemõõtmeline vaade andmetele

Andmeladu ja Mitmemõõtmeline vaade andmetele. SEMINAR POLITSEIAMETIS 11.09.2006 HENN SARV WWW.SARV.EE/FTP/HENN/POLAMET. Ariprotsess versus analüüs. Andmed tekivad äriportsessis Neid talletatakse Andmeid analüüsitakse otsustusprotsessis Otsused mõjutavad äriprotsessi. Infosüsteemi ootused.

azana
Télécharger la présentation

Andmeladu ja Mitmemõõtmeline vaade andmetele

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Andmeladu ja Mitmemõõtmeline vaade andmetele SEMINAR POLITSEIAMETIS 11.09.2006 HENN SARV WWW.SARV.EE/FTP/HENN/POLAMET

  2. Ariprotsess versus analüüs • Andmed tekivad äriportsessis • Neid talletatakse • Andmeid analüüsitakse otsustusprotsessis • Otsused mõjutavad äriprotsessi

  3. Infosüsteemi ootused • Äriprotsessis – Business Support Systems • Hõlbutsada äriprotsess • Kiiresti leida üksikuid • Kiiresti talletada toiminguid • Täpsus ja kiirus andmete muutmisel • Reaalajas toimingud - OLTP • Otsustusprotsessis – Desicion Support Systems • Hõlbutsada otsustusprotsessi • Kiiresti leida seoseid, hulki • Kiiresti teha üldistusi • Reaalajas analüüs - OLAP

  4. OLAP versus OLTP OLTP OLAP • Äriprotsess • Palju tabeleid • Normaliseeritud • Jooksvad andmed • Muutuvad andmed • Mõõdukalt indekseid • Analüüs • Vähe tabeleid • Denormaliseeritud • Andmed ajas • Staatilised andmed • Palju indekseid

  5. Normaliseerimine 3-normaalkuju denormaliseeritud • Kiired muudatused • Väike andmemaht • Optimeeritud kindlatele muudatustele (toimingutele) • Kiired päringud • Suur andmemaht • Optimeeritud “suvalistele” päringutele

  6. Kasutaja rakendus Lähteandmed Andmehoidla Andmeaidad Data Warehouse Andmete liikumine (ülekanne) Andmete poole pöördumine (vaade) Andmelao komponendid

  7. DW terminid • Lähteandmed (OLTP-süsteemid) • Andmeladu (andmete kogumiskoht, ka kogu DW) • Andmeait (spetsiaalselt korrastatud analüütilised andmed) • Andmekaevandus – kogutud andmete baasil uue info loomine

  8. Andmeülekanne • Andmete reorganiseerimine • Andmete teisendused • Andmete vääristamine • Andmete valideerimine

  9. Andmekaevamise võtted • Kruvimine, puurimine, drill • Down – sisse, detailiseerimine • Up – välja, üldistamine • Läbi – cross, kõrvutamine • Üle – through, lähteandmete lappamine • Statistilised meetodid • Klastrid • Otsustusteed

  10. Andmelao ülesehitus • Dimensioonid • Kirjeldavad tabelid andmete mingi aspekti kohta • Palju veerge (tunnuseid) • Keskmiselt või palju kirjeid • Faktitabelid • Andmetabelid ühe või mitme äriportsessi tegelike andmetega • Vähe veerge (võtmed ja faktid) • Väga palju ridu

  11. Employee_Dim EmployeeKey EmployeeID ... Product_Dim Time_Dim ProductKey TimeKey ProductID ... TheDate ... Shipper_Dim Customer_Dim ShipperKey CustomerKey ShipperID ... CustomerID ... Tähtskeem Dimension Table Fact Table Sales_Fact TimeKey EmployeeKey ProductKey CustomerKey ShipperKey Sales Amount Unit Sales ...

  12. Dimensioonid • Liikmed • Tasemed • Hierarhiad

  13. Dimensioonid, tasemed, liikmed • Product Dimension • Neli taset: All, Category, Sub-Category, Product • Category taseme liikmed: Bread, Dairy, Meat

  14. Faktitabel • Suur, kitsas ja lame • Välisvõtmed • Naturaalvõti versus surrogaatvõti • Faktid • Liidetavad • Loendatavad • Osaliselt liidetavad • Degenereeritud dimensioonid

  15. SalesFact Mitmedimensiooniline vaade andmetele Atlanta Chicago MarketsDimension Denver Grapes Cherries Dallas Melons Apples ProductsDimension Q4 Q1 Q2 Q3 TimeDimension

  16. Mõned tüüpilised dimensioonid • Aeg • Võti • Erinevad kalendrid • Erinevad skaalad • Erinevad tunnused • Isik • Võti • Isikukood • Nimed • Muud jaotused

More Related