220 likes | 398 Vues
PRAHOVÉ POJMY. doc. Ing. Kristína Machová, CSc. k ristina. m achova @tuke.sk people.tuke.sk/kristina.machova/. O SNOVA:. Charakteristika prahových pojmov Reprezentácia a použitie tabuľky kritérií Reprezentácia a použitie lineárnej prahovej jednotky
E N D
PRAHOVÉ POJMY doc. Ing. Kristína Machová, CSc. kristina.machova@tuke.sk people.tuke.sk/kristina.machova/
OSNOVA: • Charakteristika prahových pojmov • Reprezentácia a použitie tabuľky kritérií • Reprezentácia a použitie lineárnej prahovej jednotky • Reprezentácia a použitie sférickej prahovej jednotky • Operátory na pohyb v priestore pojmov • Indukcia tabuľky kritérií • Algoritmus HCT • Indukcia lineárnej prahovej jednotky • Iteratívna váhová perturbácia
PRAHOVÉ POJMY v KOCKE • Predstavujú flexibilnejšiu reprezentáciu znalostí • Kľúčovým je parciálne pokrytie • Stačí ak nový, zatiaľ neklasifikovaný, TP spĺňa iba niektoré podmienky definície triedy • Konkrétne, stačí ak stupeň pokrytia prekročí preddefinovaný prah • Reprezentácie: tabuľka kritérií, lineárna prahová jednotka, sférická prahová jednotka
REPREZENTÁCIA A POUŽITIE TABUĽKY KRITÉRIÍ • Reprezentácia: • Najjednoduchšia forma prahového popisu • Hovoríme jej aj pojem m_z_n(n je počet atribútov a prah m je prirodzené číslo medzi 1 a n) • Konjunkcia všetkých n podmienok sa nazýva prototyp alebo etalón • Pojem n_z_n prezentuje konjunkciu • Pojem 1_z_n prezentuje disjunkciu • Použitie: • TP je zaradený do tej triedy, z definície ktorej • spĺňa aspoň m podmienok.
REPREZENTÁCIA A POUŽITIE TABUĽKY KRITÉRIÍ • Numerická doména v dvojrozmernom priestore: • Pojem 2_z_2 prezentuje etalón - bod • Pojem 1_z_2 prezentuje disjunkciu – body rastra na úsečkách
REPREZENTÁCIA A POUŽITIE TABUĽKY KRITÉRIÍ • Numerická doména v trojrozmernom priestore: • Pojem 3_z_3 je prezentovaný bodom • Pojem 2_z_3 je prezentovaný úsečkami • Pojem 1_z_3 je prezentovaný plochami Geometrické útvary sú rovnobežné s osami irelevantných atribútov
REPREZENTÁCIA A POUŽITIE LINEÁRNEJ PRAHOVEJ JEDNOTKY • Reprezentácia: • Každý atribút má priradenú váhu, ktorá určuje stupeň jeho relevancie • IF • THEN chorá bunka • LTU v dvojrozmernom priestore pojmov predstavuje priamku, ktorá separuje negatívne a pozitívne TP • Použitie: • Ak TP spĺňa nerovnicu v IF časti pravidla, • potom je klasifikovaný ako pozitívny TP pojmu.
REPREZENTÁCIA A POUŽITIE LINEÁRNEJ PRAHOVEJ JEDNOTKY • Reprezentácia - poznámky: • Kombinácia váh v pravidle sa nazýva LTU (Linear Treshold Unit) • Tabuľka kritérií je špeciálnym prípadom LTU, kde váhy nadobúdajú hodnoty 1 • V N - dimenzionálnom priestore predstavuje LTU hyper - rovinu v separabilnom priestore • Váhy atribútov určujú orientáciu hyperroviny • Prahová hodnota určuje jej posunutie pozdĺž kolmice na hyperrovinu • Pojem reprezentovateľný LTU separuje lineárne pozitívne a negatívne príklady
REPREZENTÁCIA A POUŽITIE LINEÁRNEJ PRAHOVEJ JEDNOTKY
REPREZENTÁCIA A POUŽITIE SFÉRICKEJ PRAHOVEJ JEDNOTKY • Reprezentácia: • Na rozdiel od LTU, pozitívne príklady sú ohraničené zo všetkých strán • V N - dimenzionálnom priestore tvorí hypersféru • V dvojrozmernom priestore: kruh alebo elipsa • Konštanta pri atribúte udáva polohu centra a prahová hodnota určuje polomer hypersféry • Hypersféra separuje negatívne a pozitívne TP (uzatvára pozitívne TP vo svojom vnútri) • Použitie: • Ak TP spĺňa nerovnicu v IF časti pravidla, • potom je klasifikovaný ako pozitívny TP pojmu.
REPREZENTÁCIA A POUŽITIE SFÉRICKEJ PRAHOVEJ JEDNOTKY
OPERÁTORY na POHYB v PRIESTORE Pridanie atribútu do podmienky pri konštantnom prahu produkuje všeobecnejšie pojmy (1_z_2 je priamka, 1_z_3 je plocha) Nárast prahovej hodnoty pri zachovaní etalónu vedie Ku špecifickejšiemu pojmu (1_z_3 je plocha, 2_z_3 je priamka)
INDUKCIA TABUľKY KRITÉRIÍ Ak r relevantných atribútov 2 kroková indukcia: • určenie etalónu • výber prahu od 1 do r vrátane Treshold Revision (Algoritmus revízie prahu) Etalón - najfrekventovanejšie hodnoty Atribútov Má dve verzie: Treshold Revision General štartuje od najšpecifickejšieho pojmu r_z_r operátor zmenšuje prahovú hodnotu • Treshold Revision Specific • štartuje od najvšeobecnejšieho pojmu 1_z_r • operátor zvyšuje prahovú hodnotu
ALGORITMUS HCT • HeuriscicCriteriaTabels – Langley, 1996 • Dokáže zvládnuť realistickejšie situácie, keď je relevantných iba r z n atribútov • Je neinkrementálny • Postupuje smerom od špecifického k všeobecnému • Je riadený ohodnocovacou funkciou Score • Prehľadávanie je obmedzené šírkou lúča BeamSize • Používa operátory generalizácie • Vykazuje prvky kvantitatívneho usudzovania • Zvláda zašumené domény
OPERÁTORY ZOVŠEOBECNENIA 1. Vymaže atribút a zároveň zníži prah o jednotku Z hypotézy 2_z_{jedno_jadro, jeden_bičík, hrubá stena} generuje zovšeobecnenia: 1_z_{jedno_jadro, jeden_bičík} 1_z_{jedno_jadro, hrubá_stena} 1_z_{jeden_bičík, hrubá_stena} 2. Drží prah konštantný a zároveň zavádza nový atribút Z hypotézy 1_z_{jedno_jadro} Generuje zovšeobecnenia: 1_z_{jedno_jadro, jeden_bičík} 1_z_{jedno_jadro, hrubá_stena} Inverzne je možné definovať operátory špecifikácie: Pridá atribút a zároveň zvýši prah o jednotku Drží prah konštantný a zároveň vymazáva atribút
ALGORITMUS HCT Vstupy: PSET...množina pozitívnych trénovacích príkladov NSET...množina negatívnych trénovacích príkladov ATTS...množina nominálnych atribútov Výstupy:Tabuľka kritérií na klasifikáciu nových príkladov Parameter: Beam-Size počet popisov pojmov na novej úrovni Procedúra: hct(PSET,NSET,ATTS) nech etalón E je množinou najfrekventovanejších hodnôt v PSET pre každý z atribútov v ATTS nech inicializačná prahová hodnota T = veľkosť ATTS (počet atribútov) nech inicializačná množina hypotéz HSET={[T_z_E]} htc-aux(PSET,NSET,E,{},HSET)
ALGORITMUS HCT htc-aux(PSET,NSET,E,CLOSED-SET,HSET) nech OPEN-SET={} for každý pojem H v HSET nech SPECS je najšpecifickejšie zovšeobecnenie(H,E) nech NEWSET={} for každý špecifikovaný pojem S v SPECS if Score (S,PSET,NSET)>Score (H,PSET,NSET) then pridaj S do NEWSET if NEW-SET={} then pridaj H do CLOSED-SET elsefor každý pojem S v NEW-SET pridaj S do OPEN-SET if OPEN-SET={} then vráť člena s najvyšším skóre v CLOSED-SET else nech BEST-SET je Beam-Size počet najvyššie skórovaných členov zjednotenia OPEN-SET a CLOSED-SET nech CLOSED-SET sú členovia CLOSED-SET v BEST-SET nech OPEN-SET sú členovia OPEN-SET v BEST-SET hct-aux(PSET,NSET,E,CLOSED-SET,OPEN-SET)
INDUKCIA LTU LTU generuje deliace hranice priamka v rovine rovina v priestore, hyperrovina v multidimenzionálnompr. Model hyperroviny(w0 je prah a wi sú váhy atribútov): Vj=0 pre body na deliacej ploche. Body - TP, pre ktoré Vj>0 budú klasifikované ako pozitívne. Hľadáme takú množinu váh, ktorá uskutoční najväčšie množstvo korektných klasifikácií. Pre bod na deliacej ploche platí: Ukj=-wk.
ALGORITMUS IWP Iterative Weight Perturbation- Iteratívna váhová perturbácia Vstupy: ISET...množina trénovacích príkladov ATTS...množina atribútov Výstupy: LTU na klasifikáciu nových príkladov Parameter: Max_Iterations...maximálny počet iterácií Procedúra: iwp (ISET,ATTS).
ALGORITMUS IWP Procedúra: iwp (ISET,ATTS). nech H je LTU s voliteľnými váhami z intervalu (-1,1) nech BEST=H nech COUNT=Max_Iterations repeat kým neplatí COUNT=0: for každý atribút K z ATTS for každý príklad J z ISET vypočítaj Ukj použijúc H a J ulož Ukj hodnoty v zostupnom uspor. (U’) for každý susedný pár U’ hodnôt nech wk’ je zápornou priemernou hodnotou páru nech H’ je H, v ktorom je wk nahradené wk’ vypočítaj Score(H’,ISET) nech H je LTU s najvyšším skóre if Score(H,ISET)=1 then vráť hypotézu H elseifScore(H,ISET)>=Score(BEST,ISET) then nech BEST=H dekrementuj COUNT vráť hypotézu BEST.