1 / 17

Adattárházak: Bevezetés

Adattárházak: Bevezetés. Adattárházak: Bevezetés. Tematika:. Adattárházak: Bevezetés. Tematika:. Adattárházak: Bevezetés. Tematika:. Adattárházak: Bevezetés. Az adattárházak létjogosultsága Egy szervezet informatikai rendszerei: Operatív rendszerek:

cara
Télécharger la présentation

Adattárházak: Bevezetés

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Adattárházak:Bevezetés

  2. Adattárházak: Bevezetés Tematika:

  3. Adattárházak: Bevezetés Tematika:

  4. Adattárházak: Bevezetés Tematika:

  5. Adattárházak: Bevezetés Az adattárházak létjogosultsága Egy szervezet informatikai rendszerei: • Operatív rendszerek: a mindennapi ügyvitelt, üzemvitelt biztosító rendszerek (pl.: számlavezető rendszer, ügyféltörzs) • Információs rendszerek: egy lezárt időszak alatt felgyülemlett adatokat feldolgozó rendszerek (pl.: jelentéskészítő vagy adatbányász eszközök, adattárházra ültetett alkalmazások) • Egyéb nyilvántartások: (pl.: munkaidő nyilvántartás, jogosultságkezelő rendszer)

  6. Adattárházak: Bevezetés A problémák: Az operatív rendszerek általában nem alkalmasak elemzések, jelentések elkészítésére, stratégiai döntések meghozatalára mert • nem tartalmaznak történeti adatokat: Általában csak aktuális, az adott időpillanatra / adott napra vonatkozó adatokat tartalmazzák. Létezhetnek ugyan adatok a múltra vonatkozóan, de ez nem általános. Például egy számlavezető rendszerben jelen lehet egy, a számlatörténeteket tartalmazó tábla, de mondjuk a számlatípusokkal kapcsolatos változások hiányoznak. És az is biztos, hogy a számlatörténet is csak egy időre visszamenőlegesen szerepel a rendszerben. • nem integráltak: Az üzleti folyamatok egyes lépései, részfolyamatai külön rendszerekben vannak nyilvántartva. Például egy hitelezési ügylet (többek között) a következő részfolyamatokból áll: adatok rögzítése  ügyfélminősítés/hitelbírálat  szerződéskötés  folyósítás. Ezeket a részfolyamatokat más-más rendszerek szolgálják ki. Az ezen részfolyamatok során keletkező adatok is ezekbe a rendszerekbe kerülnek be és nagy részük ott is marad. Azzal is gyakran találkozhatunk, hogy egy rendszer funkcionalitásait úgy bővítik, hogy egy másik, ezzel a rendszerrel (akár online) kapcsolatban álló másik (al)rendszert hoznak létre – például költségkímélés miatt.

  7. Adattárházak: Bevezetés A problémák (folytatás): • tranzakció-központúak, nem pedig elemzés-orientáltak: Egyrészt az adatok olyan struktúrában vannak tárolva, amely biztosítja az integritást, azaz kellő mértékben normalizáltak (legalább 3NF) a relációsémák. Így azonban egy átfogóbb elemzéshez több objektumot kellene összekapcsolni, ami értelemszerűen jelentősen meghosszabbítaná a lekérdezés futási idejét. Másrészt a nagy számú tranzakciós (adatmódosító) utasítás miatt a nagy mennyiségű adatokon végzett lekérdezések elvégzése nem biztosított. Például nagyon nem valószínű, hogy egy ügyfélkiszolgálást támogató rendszer működését (az aktualizálás lehetőségét) perceken keresztül felfüggesszék. A megoldás  adattárház Az adattárház olyan adatbázis rendszer, amely historikus, integrált adatokat tartalmaz elemzésre optimalizált szerkezetben.

  8. Adattárházak: Bevezetés Az adattárház alapvető jellemzői: • Történeti adatokat tartalmaz: Jellemzően több évre vonatkozóan tartalmazza a legkülönfélébb adatokat. Ezt úgy érik el, hogy rendszeres (napi, heti, havi) illetve eseti adatáttöltéseket végeznek. Abban az esetben pedig, amikor új fejlesztést végeznek (például új adatpiacot alakítanak ki), ősfeltöltéssel biztosítják a megfelelő időintervallumra vonatkozó adatok bekerülését. • Integrált: A forrásrendszerek adatai egy platformra és egy adatbázisba kerülnek. Ehhez természetesen biztosítani szükséges a megfelelő adatkapcsolatokat (interfészeket) és sokszor típuskonverziót kell végezni. Egy excel munkafüzetben például nyilvánvalóan eltérő típusú adatok szerepelnek, mint egy Oracle adatbázisban (ahová importálni szándékozunk). • Téma-orientált, elemzésre optimalizált: Az adattárházban denormalizáltan, OLAP struktúrában helyezkednek el az adatok. Pontosabban, mivel a struktúraváltás az adattárházban megy végbe, az OLAP struktúra a legfelső, a kiaknázási szintre biztosan igaz, a legalsó, a forrásrendszerek felé nyitott szinten pedig OLTP szerkezetben tárolódnak az adatok. A két szint között valahol történik meg a struktúraváltás.

  9. Adattárházak: Bevezetés Az „elemzésre optimalizált” az alábbiakat is magába foglalja: • Az egyes adattáblák egyrészt particionáltak és kellő mértékben indexáltak. • Az adatáttöltéseken és a szükséges korrekciókon (pl. adattisztítás) kívül nem történik adatmanipuláció. Tehát az egyes felhasználók csak lekérdezéseket hajtanak végre, ezért az adatok „nem mozognak”, az áttöltési időszaktól eltekintve nyugodtan lehet erőforrás-igényesebb lekérdezéseket futtatni.

  10. Adattárházak: Bevezetés Az adattárház helye a többi informatikai rendszer között ED (TS) IS (TS) IS (TS) IS (TS,SS) ED OS: Operatív rendszer ( Operational System) SS: Forrásrendszer (Source System) TS: Célrendszer (Target System) IS: Információs rendszer (Information System) ED: Elektronikus dokumentum (Electronic Document) IS OS DWH OS ED (SS) OS (SS) OS (SS) OS (SS) OS (SS) OS ED

  11. Adattárházak: Bevezetés Az adattárház helye a többi informatikai rendszer között Mint ahogy a fenti ábrából is jól látható, az adattárház (Data WareHouse) forrásrendszerei túlnyomó részt a szervezet operatív rendszerei és egyéb nyilvántartásai. Természetesen nem minden operatív rendszer forrásrendszere az adattárháznak és az is előfordulhat, hogy információs rendszer az input. Az adattárház másfelől forrásrendszere az információs rendszereknek, de nem feltétlenül csak az adattárház lehet az input. Arra is akad példa, hogy egy, az adattárházra „ültetett” rendszer szolgál forrásrendszerként, de ez ritka gyakorlat. Egy szervezet központi rendszere/rendszerei (szinte) biztosan forrásrendszerei az adattárháznak. Ez érthető is, hiszen a legtöbb információ ebből/ezekből a rendszerekből nyerhető ki. Ilyen egy bank számlavezető rendszere vagy egy kereskedelmi tevékenységet folytató cég készlet és/vagy értékesítéseket nyilvántartó rendszere (pl.: SAP).

  12. Adattárházak: Bevezetés Információs rendszerek … Az adattárház egy lehetséges felépítése (vázlatosan) IS1 IS2 IS3 IS4 ISn Információ kinyerése Adatpiacok (ROLAP vagy MOLAP struktúrában) Kocka- generálás, Adatpiacosítás Historikus adatok (ROLAP struktúrában) Delta-képzés (historizálás) Adattárház Metaadat-kezelő rendszer Integrált előző napi adatok (ROLAP struktúrában) Struktúraváltás, tisztítás, transzformálás Forrásrendszerek előző napi lenyomata (OLTP struktúrában) Szűrés, közös platformra hozás Forrásrend-szerek … SS1 SS2 SS3 SS4 SSn

  13. Adattárházak: Bevezetés Metaadat-kezelés A felhasználók, a fejlesztők és az üzemeltetők munkáját támogatandó nyilvántartásba veszik a forrásadatok és a kinyert információk közötti összefüggéseket: • Üzleti metaadatok (az adatok szemantikája) • Technikai metaadatok (az adatok szintaktikája) szűrés transzf. transzf. DS IS DWH

  14. Adattárházak: Bevezetés Az adattárházak kiaknázási módjai • Adatpiacokon keresztül: Az adatpiacokat a kiszolgált terület profilja és/vagy a tevékenységi kör szerint célszerű kialakítani. Általában valamilyen felhasználóbarát felületet biztosító rendszert/alkalmazást fejlesztenek rá vagy szereznek be és adaptálják az adatpiachoz. Többek között ilyen terület lehet: • ügyfélkapcsolat kezelés • eszköz-forrás menedzsment • kockázatkezelés • kötelező jelentésszolgálat • Közvetlenül az adattárház valamelyik szintjéről: Valamelyik sémájából, a felhasználó nyilvántartásba vétele és a szükséges olvasási jogosultságok megadása után. Ezt a lehetőséget akkor érdemes választani, amikor a kiaknázandó információ mennyisége nem teszi indokolttá külön adatpiac létrehozását, viszont kibővíteni sem célszerű egy már meglévő adatpiacot.

  15. Adattárházak: Bevezetés Az adattárházak jellemző felhasználási területei

  16. Adattárházak: Bevezetés Célrendszerek • Döntéstámogató Rendszerek • Vezetői Információs Rendszerek • Adatbányászó alkalmazások • Jelentéskészítő rendszerek

  17. Köszönöm a figyelmet!

More Related