1 / 19

DATA WAREHOUSE

DATA WAREHOUSE. - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD ) Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data Mining. DATA MINING & KDD. DATA MINING.

fay
Télécharger la présentation

DATA WAREHOUSE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Tujuan : MahasiswaDapatmemahamikonsep KDD yang merupakantujuanakhirdari Data Warehouse dan Data Mining

  2. DATA MINING & KDD

  3. DATA MINING • Data Mining adalahkegiatanuntukmenemukaninformasiataupengetahuan yang bergunasecaraotomatisdari data yang jumlahnyabesar. • Data Mining merupakansalahsatuprosesdarikeseluruhanproses yang adapadaKnowledge Discovery in Databases (KDD).

  4. KDD • Knowledge Discovery in Databases (KDD) merupakansekumpulanprosesuntukmenemukanpengetahuan yang bermanfaatdari data. • Kumpulan prosesdalam KDD meliputi : pembersihan data (data cleaning), integrasi data (data integration), pemilihan data (data selection), transformasi data (data transformation), penambangan data (data mining), evaluasipola (pattern evaluation), danpresentasipengetahuan (knowledge presentation). • Berdasarkandefinisiiniterlihatbahwadata mining hanyamerupakansalahsatuprosesdarikeseluruhanproses yang adapada KDD, tetapimerupakanproses yang sangatpentingdalammenemukanpola-pola yang bergunadarisejumlah data yang besar (data tersebutbisadisimpandalambasisdata, Data Warehouse, atau media penyimpananinformasilainnya).

  5. DATA MINING & KDD DATA WAREHOUSE

  6. KDD DATA MINING DATA WAREHOUSE

  7. KDD vs. DM • MenurutCabena, Data Mining =Knowledge Discovery in Database (KDD). • MenurutJiawei Han, Data Mining merupakanSubset atausalahsatutahapdari KDD saja. Sehingga, batasanini yang selanjutkandigunakan. • Data Mining bertujuanmengekplorasi basis data untukmenemukanpola-polapengetahuan yang tersembunyididalam data tersebut.

  8. TAHAPAN KNOWLEDGE DISCOVERY IN DATABASE Menurut Peter Cabena, Tahapan – tahapandalam KDDadalahsebagaiberikut : • PenentuanSasaranBisnis(Business Objective Determination) • Persiapan Data (Preparation Data) • Data Selection • Data Preprocessing • Data Transformation • Data Mining • Anaysis of Result • Assimilation of Knowledge

  9. Business Objective Determination - 1 • Merupakansebuahtahapan yang mendefinisikanpermasalahanatautantanganbisnisdenganjelas. Hal inimerupakanaspek yang sangatesensialdalamsetiapproyek data mining. • ContohSasaranBisnis : Mengembangkansuatustrategi marketing untukmempertahankanloyalitas customer diJawa Tengah danJawaTimuruntukproduk soft drink dengan brand danukurantertentu (200ml dalamkotakalumunium) selamabulan April, Mei , Juni yang akandatang. Perusahaan akanmenggunakankombinasidariberbagaistrategi marketing (mixed marketing), yang salahsatunyaadalahdirect mail campaignkepada customer yang tampaknya "mudahrusak" loyalitasnya.

  10. Business Objective Determination - 2 • Sehinggadampakkeseluruhan KDD adalah : • – Data Selection: dipilih customers yang membeliproduk soft drink 200 ml dalamkotakalumuniumdiJawa Tengah danJawaTimur. • – Data Transformation: customers yang membeliproduk soft drink 200 ml dalamkotakalumuniumdisortingdalam 10 kategori, yang masing-masingmembedakantingkatloyalitasnya: membeliproduktersebut 0-10%, 11-20%, ..... , 81-90%, 91-100% sepanjangwaktupembeliannya. Selanjutnya data inilah yang akandibawaketahap data mining.

  11. Persiapan Data (Preparation Data) -1 • Merupakantahapanuntukmempersiapkan data yang diperlukanuntukproses data mining. Tujuannyaadalah agar data yang digunakanbenar-benarsesuaidenganpermasalahan yang akandipecahkan, dapatdijaminkebenarannya, dandalam format yang sesuai/tepat. • Tahap yang paling banyakmengkonsumsi resources (manusia, biaya, waktu) yang tersedia. Biasanyamencapai 60% keseluruhanproyek KDD.

  12. Persiapan Data (Preparation Data) -2 • Data Selection • Mengidentifikasisemuasumberinformasi internal daneksternaldanmemilihsebagiansajadari data yang diperlukanuntukaplikasi data mining. • Data Preprocessing • Meyakinkankualitas data yang telahdipilihpadatahapansebelumnya. 2 issue yang seringdihadapkanpadatahapaniniadalah Noisy Data dan Missing Value. • Data Transformation • Mengubah data kedalam model analitissertamemodelkan data agar sesuaidengananalisa yang diharapkandan format data yang diperlukanolehalgoritma data mining.

  13. Data Mining -1 • Melakukanprosespencarianpengetahuanterhadap data yang ditransformasikanpadatahapsebelumnya. • ContohPengetahuanberbentukAssociation Rule untukkasus "Soft Drink“: • IF soft drink sejenisdenganukuran yang lebihbesar (bukanbotolkecil) dibelilebihdari 58% dalamsejarahpembelian soft drink seorang consumer • THEN consumer tersebutdiprediksi Loyal. • Pemilihantugas data mining : pemilihan goal dariproses KDD misalnyaklasifikasi, regresi, clustering, dll.

  14. Data Mining -2 • Proses Data mining yaituprosesmencaripolaatauinformasimenarikdalam data terpilihdenganmenggunakanteknikataumetodetertentu. Teknik, metode, ataualgoritmadalamdata mining sangatbervariasi. Pemilihanmetodeataualgoritma yang tepatsangatbergantungpadatujuandanproses KDD secarakeseluruhan.

  15. Anaysis of Result • Menginterpretasikandanmengevaluasi output daritahap mining: patterns. • Pendekatananalisa yang digunakanakanbervariasimenurutoperasi data mining yang digunakan, tetapibiasanyaakanmelibatkanteknikvisualisasi.

  16. Assimilation of Knowledge • Menggunakanhasil mining yang telahdievaluasikedalamperilakuorganisasidansisteminformasiperusahaan.

  17. DATA MINING dan PROSES KDD - 1

  18. DATA MINING dan PROSES KDD - 2 • Pembersihan data (Data Cleaning) • Digunakanuntukmembuang data yang tidakkonsistendan noise. • Intergrasi Data (Data Integration) • Data yang diperlukanuntuk data mining tidakhanyaberasaldarisatu database tetapijugaberasaldaribeberapa database atau file teks. Hasilintegrasi data seringdiwujudkandalamsebuah data warehouse karenadengan data warehouse, data dikonsolidasikandenganstrukturkhusus yang efisien. Selainitu data warehouse jugamemungkinkantipeanalisaseperti OLAP. • Transformasi data • Transformasidanpemilihan data iniuntukmenentukankualitasdarihasil data mining, sehingga data diubahmenjadibentuksesuaiuntukdi-Mining. • AplikasiTeknik Data Mining • Aplikasiteknik data mining sendirihanyamerupakansalahsatubagiandariproses data mining. Adabeberapateknik data mining yang sudahumumdipakai. • Evaluasipola yang ditemukan • Dalamtahapinihasildariteknik data mining berupapola-pola yang khasmaupun model prediksidievaluasiuntukmenilaiapakahhipotesa yang adamemangtercapai. • PresentasiPengetahuan • Presentasipola yang ditemukanuntukmenghasilkanaksitahapterakhirdariproses data mining adalahbagaimanamemformulasikankeputusanatauaksidarihasilanalisa yang didapat.

  19. INPUT DAN OUTPUT DATA MINING

More Related