SUURTE ANDMEBAASIDE PROJEKTEERIMINE

1. SUURTE ANDMEBAASIDE PROJEKTEERIMINE

2. LOENGU KAVA M�ned t�demused andmebaasidest ja infos�steemidest Suured andmebaasid (ja infos�steemid) Andmelaod - t�eliselt suured andmebaasid

3. M�NED T�DEMUSED ANDMEBAASIDEST JA INFOS�STEEMIDEST

4. 1. T�DEMUS Korrektselt toimiva infos�steemi t�htsaimaks aluseks on k�ll ��igesti� projekteeritud ANDMEBAAS, kuid see, mis peab olema ��igesti� projekteeritud, on oma m��tmetelt tunduvalt laiem kui seda on andmemudel.

5. 2. T�DEMUS Andmebaaside projekteerimisel v�ib rikkuda K�IKI andmebaaside projekteerimise teooria poolt esitatud printsiipe - iga rikkumine peab olema aga TEADLIK ja P�HJENDATUD.

6. 3. T�DEMUS CASE-vahendid ei ole mingid �imerelvad�, mille rakendamine garanteerivad vajadustele vastavate ja korrektselt toimivate mudelite loomise - nad v�imendavad lollust palju paremini kui tarkust. Standardite j�rgimine tagab korrektselt vormistatud aga mitte igal juhul t��tava mudeli Vaatamata sellele on CASE-s�steemide kasutamine korrektse tulemuse saamiseks v�ltimatu Loota tuleb ainult iseendale, mitte CASE-s�steemile.

7. 4. T�DEMUS T��tava mudeli loomiseks ei piisa olemasoleva situatsiooni fikseerimisest - selleks on vaja vaadata asju tunduvalt laiemalt, kui seda eeldab konkreetse �lesande lahendamine ja tunduvalt kaugemale tulevikku kui seda on Hea mudel on see, kus on suudetud kristalliseerida �ajatus� st. mudeli d�naamiline muutumine koos objektiga, mida ta kirjeldab.

8. 5. T�DEMUS Olenemata andmebaasi v�i infos�steemi v�iksusest peab kogu tema modelleerimine olema l�bi viidud sama p�hjalikkusega kui mistahes suure infos�steemi korral - esialgselt v�ikestel s�steemidel on kalduvus kasvada suurteks. H�sti projekteeritud infos�steemi saab erinevate mahtude muutumisel laiendada, halvasti projekteeritud infos�steem tuleb aga v�lja vahetada.

9. 6. T�DEMUS Infos�steemidel on kalduvus elada kauem, kui nende loojad seda oma k�ige halvemaski unen�os n�inud on. Mida paremini on projekteeritud infos�steem, seda kauem ta elab. K�ige aluseks on h�sti projekteeritud ja realiseeritud andmebaas.

10. 7. T�DEMUS Reaalselt eksisteeriv andmebaas omab oma terviklikku ja tegelikku t�hendust ainult vaadelduna koos tema kasutuskeskkonna ja selle arenguga (eesm�rgid, meetodid, vahendid, areng, kasutajad, �)

11. 8. T�DEMUS Infos�steemide loomisel tuleb meeles pidada, et kahjuks eksisteerib selline segav faktor nagu seda on tegelik elu: infos�steemi �kski komponent ei tohi s�ttida piiranguid, mida tegelik elu ei sea, �kski infos�steemi poolt seatud piirang ei tohi olla nii j�ik, et mingil hetkel peaks hakkama �reaalset maailma� �h��lestama� infos�steemi j�rgi.

12. 9. T�DEMUS Peaaegu kunagi ei �nnestu alustada t�hjalt kohalt. See t�hendab aga seda, et nii uue loomisel kui vana t�iendamisel tuleb paratamatult j�lgida ja arvestada sellega, mis on tehtud varem. Mudeli vahetusel: �Hea mudel� realiseerib endas �vana� ilma eelmist mudelit kopeerimata. Mudeli muutusel: �Head mudelit� on v�imalik muuta ilma olemasolevaid, mudeliga seotud protseduure rikkumata.

13. 10. T�DEMUS Korrektselt projekteeritud ja realiseeritud infos�steemid (ka suured) �lubavad� oma loojatel elus veel m�ndagi huvitavat teha. �Ligadi-logadi� infos�steemid muudavad enda loojad oma �orjadeks�.

14. SUURED ANDMEBAASID ( JA INFOS�STEEMID )

15. ANDMEBAAS - KOGUM SEOSTATUD ANDMEID? Struktureeritud andmed (schemas, tables, views, ...) Seosed (referential integrity) Andmeotsingu kiirendid (indexes) Piirangud (data types, formats, constraints) S�ndmuste lokaliseerijad (triggers) Meetodid (procedures) K�sitluskeel (SQL, DBMS specific RLA, �) ...

16. AGA LISAKS SELLELE... Monitooringu vahendid Administreerimisvahendid kasutajate haldamine (user rights administration) kindluskoopiate tegemine/taastamine (backup/restore) j�udluse h��lestamine (performance tuning) ... �iguste tagamise vahendid Liidesed teiste s�steemidega (ODBC, JDBC, native links, XML, MQ support, external procedures,�) Arendusvahendid (3GL, 4GL programming tools, CASE-systems, team managing, version control, �) ...

17. MIDA M�ISTA SUURTE ANDMEBAASIDE ALL ? �Suur� ANDMEMAHULT ? �Suur� ERINEVATE ANDMEKOGUDE ARVU POOLEST ? �Suur� KASUTAJATE ARVULT ? �Suur� KASUTAJATE PAIKNEMISE LAIA GEORAAFILISE PIIRKONNA POOLEST ? �Suur� ANDMEKOGUDE PAIKNEMISE LAIA GEOGRAAFILISE PIIRKONNA POOLEST ? �Suur� �RILOOGIKA KEERUKUSE POOLEST ? �Suur� P��RDUMISTE ARVU (REAKTSIOONI KIIRUSE) POOLEST ? �Suur� ERINEVATE MUUTUSTE SAGEDUSE POOLEST ? �Suur� INFO KONFIDENTSIAALSUSE POOLEST ?

18. MIS ERISTAB SUURT JA V�IKEST ANDMEBAASI ? �F��silistelt m��tmetelt� on (tavaliselt) suure andmebaasi enamik numbriliselt v�ljendatavaid parameetreid kas palju suuremad v�i palju v�iksemad kui v�ikestel andmebaasidel. Rakendamise seisukohalt vaadatuna on suurte andmebaaside �elukeskkond� struktuurilt palju keerulisem ja kallim kui v�ikestel andmebaasidel (erinev halduskulude suurus). Tavaliselt esitatakse suurtele andmebaasidele suuremad t��kindluse ja turvalisuse n�uded.

19. MIS ON ERINEV SUURE JA V�IKESE ANDMEBAASI LOOMISE PROTSESIS Oma funktsioneerimise alguses on enamik andmebaase �v�ikesed�. Projekteerimise ja loomise protsessi kulgemise seisukohalt vaadatuna ei tohiks olla mingit vahet (kui t�� tehakse korrektselt). Andmebaaside korral, mis eeldatavasti oma �elu jooksul� muutuvad �suurteks�, tuleb anal��si ja projekteerimise k�igus p��rata t�helepanu paljudele faktoritele, mille uurimiseks �v�ikestena elavate� andmebaaside puhul pole mingit m�tete aega ja raha kulutada. Riskide hulk on tunduvalt suurem.

20. OMADUSED, MIS POLE SUURELE ANDMEBAASILE KOHUSTUSLIKUD SUUR KASUTAJATE ARV KASUTAJATE PAIKNEMISE LAI GEORAAFILINE PIIRKOND ANDMEKOGUDE PAIKNEMISE LAI GEOGRAAFILINE PIIRKOND TEGEVUS-LOOGIKA KEERUKUS ANDMEBAASI POOLE P��RDUMISTE SUUR ARV ERINEVATE MUUTUSTE SUUR SAGEDUS INFO RANGEIM KONFIDENTSIAALSUS Aga just need v�ivad olla omadused, mis teevad andmebaasist �SUURE� !

21. KONTSEPTSIOONIDE JA VAHENDITE VALIMINE Anal��s ja eesm�rkide spetsifitseerimine (!) Infos�steemi loogiline arhitektuur (tsentraliseeritud, hajus; 2-kihiline, 3-kihiline, N-kihiline, 0-kihiline; �) Infos�steemi f��siline arhitektuur (riistvara, s�steemitarkvara, teenuse pakkujad/vahendajad, ...) Info-logistika mudel (andmete liikumine baaside ja rakenduste vahel) Andmebaasis�steemid (�ks v�i mitu?) Arenduskeskkonnad (arendustarkvara v�i outsourcing?) Kasutatavad valmisprogrammid (ka outsourcing) Andmekaitse metoodika ja vahendid IT organisatsioon ja funktsioonide jaotus.

22. EESM�RKIDE P�STITAMINE Ilma eesm�rki p�stitamata (spetsifitseerimata) ei ole v�imalik luua ei suurt ega v�ikest andmebaasi. Kuid mida �suurem� on andmebaas seda t�psemalt tuleb spetsifitseerida eesm�rgid. Lisaks eesm�rgile tuleb projekteerida (spetsifitseerida) ka selle eesm�rgini j�udmise tee (sammud). Kuid mida �suurem� on andmebaas seda detailsem tuleb see spetsifikatsioon koostada. Esimene samm on tavaliselt pikem aga see ei tohi olla liiga pikk. Tuleb minimiseerida esimese sammu pikkust. L�hemaid samme on lihtsam (loe: odavam) tagasi v�tta. Andmebaasi loomine saab olla ainult alam-eesm�rk - mitte eesm�rk omaette - andmebaasi saab hakata projekteerima alles p�rast s�steemi �ldvaate spetsifitseerimist.

23. ANAL��S: TOETATAVAD INFOT��D Milliseid infot�id teeme me praegu? Milliseid infot�id teeme me aasta p�rast? Kahe aasta p�rast? Kolme aasta p�rast? Viie aasta p�rast? (hulk, keerukus v�rreldes praeguste tegevustega) Kui suur on eeldatavalt/soovitavalt infot�� tegijate arv? Millise aja jooksul? Millise tasemeni l�heme me infos�steemi poolse toetusega? Millise aja jooksul? Kas planeeritav infos�steemi poolt toetatav infot��de kogum esitab n�udmisi infos�steemi struktuurile?

24. ANAL��S: ANDMEMAHTUDE HINDAMINE Millised andmebaasid meil on praegu olemas? Milline on andmete maht praegu? Millised andmekogumid me peame juurde looma? Milliseid andmekogusid peame me t�iendama? Milline on andmete eeldatav maht viie aasta p�rast? Milline on andmete eeldatav maht k�mne aasta p�rast? Milline on maksimaalne v�imalik andmemaht? Kas planeeritav andmemaht ja struktuur esitab n�udmisi infos�steemi struktuurile

25. ANAL��S: KASUTAJATE HULGA HINDAMINE Palju meil on infos�steemi kasutajad praegu? Kus nad paiknevad? Milline on nende profiil? Kas me tahame kasutajate arvu suurendada, v�hendada v�i hoida samades piirides? Palju meil on kasutajaid eeldatavalt kahe aasta p�rast? Milline on nende struktuur? Palju meil on kasutajaid eeldatavalt viie aasta p�rast? Milline on nende struktuur? Milline on maksimaalne v�imalik kasutajate arv? Kas planeeritav kasutajate arv v�i struktuur esitab n�udmisi infos�steemi struktuurile?

26. ANAL��S: KASUTAJATE AKTIIVSUSE HINDAMINE Kui palju koormab meie ressurssi �ks kasutaja? Mitu p��rdumist teeb ta keskmiselt s�steemi poole p�evas? Tunnis? Minutis? Sekundis? Milline on kasutaja maksimaalne aktiivsus? Kuidas muutub kasutaja aktiivsus eeldatavasti �he aasta jooksul? Kahe aasta jooksul? Viie aasta jooksul? Kui suur on v�imalik maksimaalne kasutajate aktiivsus? Kas kasutajate planeeritud aktiivsus v�i selle suur muutumine esitab n�udmisi infos�steemi struktuurile?

27. ANAL��S: RESSURSI KOORMATUSE HINDAMINE Kui suur/v�ike on k�ige suurem/v�iksem tunni jooksul s�steemi poole tehtavate p��rdumiste arv? Tunnis? Minutis? Sekundis? Kui suur on keskmine tunni jooksul s�steemi poole tehtavate p��rdumiste arv? Tunnis? Minutis? Sekundis? Mitu andmebaasitransaktsiooni genereerib iga s�steemi poole p��rdumine? Kas s�steemi planeeritud koormatus v�i selle l�hikese aja jooksul suurtes piirides muutumine esitab n�udmisi infos�steemi struktuurile?

28. ANAL��SI EESM�RK: J�UDLUS

29. VALIK: INFOS�STEEMI ARHITEKTUUR

30. VALIK: ANDMEBAASI KESKKOND Komplektina koos tuleb valida server(id) ja andmebaasimootor Kriteeriumiks on � v�ime teenindada anal��si etapil m��ratletud arv transaktsioone sekundis Oluline on valiku hetkel teada andmete �ldist struktuuri ja andmebaasi poole p��rdumise metoodikat, kuna just see v�ib m��rata �he v�i teise komplekti valiku

31. VALIK: VALMISPROGRAMMID Esmaselt m��rab v�imalike valitavate valmisprogrammide kogumi IS valitud arhitektuur Valmistarkvara saab valida etapiliselt �ldiselt �ksikule. Iga j�rgmine tase piirab j�rgmise taseme valikuid. Nii palju kui v�imalik tuleb kasutada olemasolevaid valmisprogramme � nende t��v�imet ja j�udlust on v�imalik testida. J�udlustestid on v�ga olulised J�udluse testil on m�tet ainult siis, kui seda tehakse reaalsele t��keskkonnale ligil�hedases keskkonnas Valmisprogrammid annavad tavaliselt kiire, kuid mitte parima (k�ige sobivama) lahenduse. Kiire lahenduse huvides tuleb nad v�tta kasutusele �nii nagu nad on�, kohandades �riprotsesse.

32. VALIK: ARENDUSVAHENDID Iga arendusvahend on spetsiifilise otstarbega �valmisprogramm�, mis tuleb sobitada k�igi teiste �valmisprogrammidega� Arendusvahendid peavad olema �sama kaliibriga� v�rreldes p�stitatud �lesandega ja teiste valitud tehnoloogiliste lahendustega.

33. VALIK: TURVAMEETMED Ei ole olemas t�iesti universaalseid lahendusi - iga rakendus esitab mingeid spetsiifilisi, temale ainuomaseid n�udmisi �Standardlahendused� ei paku �ldjuhul piisavat kaitset Kaitsma peab nii andmeid kui tehnoloogiat Turvas�steemi n�rgim l�li on inimene, kelle �ustavuse tagamiseks� tuleb tema �j�rele valvata� Meetmete v�imsuse m��rab kaitstava �vara� v��rtus - turvas�steemi ei ole m�tet �ldjuhul ehitada kallimat kui on �vara�, mida see kaitsma peab

34. ANDMELAOD - T�ELISELT SUURED ANDMEBAASID

35. INFOT��TLUSE EESM�RK Infot��tluse eesm�rgiks on andmete muutmine informatsiooniks ! Miks? Sellep�rast, et �riprotsessi juhtimises tekkivatele k�simustele on v�imalik vastata ainult siis kui omada informatsiooni ja teadmisi kuidas seda informatsiooni kasutada eksisteerivate probleemide lahendamisel

36. EELDUSED ANDMETE MUUTMISEL INFORMATSIOONIKS Kui sul on andmed olemas ja Sa tead millised andmed Sul on olemas ja Sa oled suuteline vajalikud andmed k�tte saama ja Sa v�id usaldada nende andmete �igsust!

37. ANDMELADU Andmeladu (Data Warehouse) on see osa terviklikust infos�steemi andmearhitektuurist, mis esitab andmet��tlusprotsessi jaoks andmeid kui �ks ja �htne allikas, mis on:

38. ANDMELAO TOIMIMISE KESKKOND

39. ANDMELAO T��PILINE ANDMEVOOG

40. ANDMEV�TT - P�HILISED LIIGID Staatiline andmev�tt Tehingus�steemidega juhitav andmev�tt Baasihalduss�steemi trigeritel p�hinev andmev�tt

41. STAATILINE ANDMEV�TT Staatiline andmev�tt (momentv�tte-tehnoloogia, snapshot): v�tab allikast (tehingubaasist) andmete jooksva seisu ei s�ltu andmeallika muutumistest ei s�ltu allika andmete perioodilisusest on lihtsaim

42. TRIGERIP�HINE ANDMEV�TT Baasihalduss�steemi trigeritel p�hinev andmev�tt (inkrement-tehnoloogia): andmebaasi sisseehitatud v�i tehinguhalduri omadus sidust��tlus kohene, st. ajalise viiteta v�etakse vaid uued ja muutunud andmed

43. METAANDMETE LIIGID tehingus�steemide, �ldhoidla, erihoidlate ja h�iveprotseduuride projekteerimise ja modelleerimise metaandmeid � kavandi metaandmed andmehoidla � haldamise metaandmed andmehoidla � kasutamise metaandmed

44. METAANDMED ELUTS�KLIS

45. EESTI �HISPANGA ANDMELADU Andmelao s�steem: SyBase IQ Anal��sis�steem: Business Objects Andmelao maht: 380 GB (07.11.2002) Sisalduv ajalugu: 3 aastat Suurim tabel: 0,5 miljardit rida Raporti moodustamise tavaline aeg: 2-5 sek Raporti moodustamise keskmine aeg: 18 sek Raporti moodustamise max. aeg: 2 min

46. Tegelikult on see k�ik palju kordi keerulisem...... ja rohkem m��ramatust sisaldav!

SUURTE ANDMEBAASIDE PROJEKTEERIMINE

SUURTE ANDMEBAASIDE PROJEKTEERIMINE

Presentation Transcript

Füüsikalise taseme projekteerimine Kompleksete süsteemide iseärasused

Maailm andmebaaside “kammitsas”

Hoonete energiatõhusus: eesmärgid, projekteerimine ja kontroll

Kuidas töötajatele infot jagada suurte muutuste ajal?

Andmebaaside alused

Hea suurte ja kõvade seemnete aasta

Digitaalskeemide projekteerimine ja test VHDL ja digitaalskeemide modelleerimine

Andmeturve Andmebaaside turve. Võrguturve

SUURTE ANDMEBAASIDE PROJEKTEERIMINE

Muusikapood Projekt aines “Infosüsteemide analüüs ja projekteerimine ”

Andmeturve ja krüptoloogia, XIII Andmebaaside turve. Võrguturve

Objekt-orienteeritud projekteerimine

Projekteerimine

Testimise projekteerimine: Labor 2 BIST Optimization

Aksioomidest lähtuv projekteerimine Axiomatic Design