200 likes | 363 Vues
Inkrementalno spajanje prostora inačica. Dejan Novak Krešimir Prcela Igor Kozina. Uvod. Svojstva orginalnog oblik prostora inačica: održavanje skupa hipoteza predstavljanje tog skupa samo sa najspecifičnijim i najopćenitijim definicijama
E N D
Inkrementalno spajanje prostora inačica • Dejan Novak • Krešimir Prcela • Igor Kozina
Uvod • Svojstva orginalnog oblik prostora inačica: • održavanje skupa hipoteza • predstavljanje tog skupa samo sa najspecifičnijim i najopćenitijim definicijama • Nedostatak: skup hipoteza mora odražavati striktnu konzistentnost sa podacima
Uvod • Algoritam eliminacije kandidata također pretpostavlja striktnu konzistentnost s podacima - eliminira iz prostora inačica sve hipoteze koji nisu konzistentni sa novim primjerom
Generaliziranje prostora inačica • Uklanja pretpostavku o striktnoj konzistentnosti s podacima • Prostor inačica je i dalje skup hipoteza koji se može efikasno predstaviti s minimalnim i maksimalnim elementima skupa
G1 G2 G12 VS1 VS12 VS2 S12 S1 S2 Spajanje prostora inačica • Uklanja pretpostavku o striktnoj konzistentnosti s podacima • Bazira na presjeku prostora inačica
Spajanje prostora inačica • Algoritam u dva koraka: • za svaki par elemenata s1 iz S1 i s2 iz S2 generiraj njihove najspecifičnije zajedničke generalizacije. Dodijeli skupu S12uniju svih takvih najspecifičnijih generalizacija parova elemenata iz dva orginalna S skupa. Slično, generiraj skup svih najopćenitijih specijalizacija elemenata iz dva orginalna G skupa, G1 i G2, za novi G skup G12. • ukloni iz S12one elemente koji nisu specifičniji od nekog elementa iz G1 i nekog elementa iz G2. Također ukloni one elemente koji su općenitiji od nekog drugog elementa iz S12 (generiranog iz drugog para elemenata iz S1 i S2). Slično tome, ukloni iz G12one elemente koji nisu općenitiji od nekog elementa iz S1 i S2, kao i one koji su specifičniji od nekog drugog elementa iz G12.
Inkrementalno spajanje prostora inačica • Sa pojavljivanjem nove informacije u procesu učenja – najčešće klasificiranog primjera - dolazimo do skupa relelevantnih hipoteza za tu informaciju, i taj skup presjecamo sa prostorom inačica generiranim iz prethodnih informacija • Rezultirajući prostor inačica reflektira sve prošle informacije, kao i novu informaciju
VSM VSi VSn+1 VSn Inkrementalno spajanje prostora inačica • Kako dolazimo do nove informacije generira se prostor inačica za tu informaciju (VSi) i presjeca sa prostorom inačica dobivenim iz prethodnih podataka (VSn) čime se dobiva novi prostor inačica (VSn+1), koji će u narednom koraku biti presječen sa prostorom inačica dobivenim iz nove informacije
Emulacije algoritma eliminacije kandidata • Ključna ideja emulacije algoritma eliminacije kandidata je da se formira prostor inačica hipoteza striktno konzistentnih sa svakim individualnim primjerom i napravi presjek tih prostora inačica pomoću inkrementalnog spajanja prostora inačica
Primjer učenja • Robot na proizvodnoj liniji koji manipulira objektima • Robot određene objekte nije u stanju uhvatiti • Zadatak učenja je da formira pravila koja će omogućiti robotu da predvidi koje objekte može zgrabiti • Robot može identificirati, i prema tome jedina svojstva koja se mogu pojaviti u naučenim pravilima, su oblik i veličina
oblik veličina ? ? poliedar sfera velika mala kocka piramida oktaedar Primjer učenja • Hipoteze su oblikaVeličina(X, mala) Oblik(X, poliedar) Uhvatljiv(X), • Kraći zapis: [mala, poliedar].
Emulacija algoritma eliminacije kandidata • Ideja je da za svaki novi primjer za učenje formiramo skup hipoteza koje korektno klasificiraju dani primjer • Taj prostor inačica tada presjecamo sa prostorom inačica dobivenim iz prethodnih podataka, formirajući novi prostor inačica koji sadrži hipoteze konzistentne sa svim prethodnim podacima i novim primjerom • Implementacija algoritma eliminacije kandidata pomoću inkrementalnog spajanja prostora inačica zahtjeva predstavljanje prostora inačica hipoteza koje korektno klasificira zadani primjer pomoću najopćenitije (skup G) i najspecifičnije (skup S) granice
Emulacija algoritma eliminacije kandidata • Ako je primjer pozitivan, njegov S skup se postavlja na najspecifičnije hipoteze koje su konzistentne s primjerom. To u većini slučajeva znači da skup S sadrži primjer kao jedini element. Skup G sadrži najopćenitiju hipotezu. • Ako je primjer negativan, negov S skup sadrži najspecifičniju hipotezu, dok se skup G sastoji od minimalnih specijalizacija najopćenitije hipoteze koje su konzistentne s primjerom. Ta dva skupa tvore prostor inačica konzistentan s danim primjerom.
Emulacija algoritma eliminacije kandidata • Algoritam eliminacije kandidata implementiran pomoću inkrementalnog spajanja prostora inačica inicijalno počinje sa potpunim prostorom inačica – skup S sadrži najspecifičniju hipotezu dok skup G sadrži najopćenitiju hipotezu • Svaki primjer se pretvara u prostor inačica i kao takav se spaja sa prostorom inačica dobivenim iz prethodnih primjera • Taj se proces ponavlja dok se ne dobije prostor inačica sa jednim elementom
Emulacija algoritma eliminacije kandidata – prvi primjer • Početni prostor inačica: S = {[, ]}, G = {[?, ?]} • Prostor inačica za primjer: S={[mala, kocka]}, i G={[?,?]} • Algoritam spajanja prostora inačica: • 1. korak: najspecifičnija generalizacija parova iz dva orginalna S skupa – generalizacija elemenata [, ] i [mala, kocka]: {[mala, kocka]} • 2. korak: u drugom koraku se izbacuju oni elementi skup S koji nisu minimalni i oni koji nisu specifičniji od elemenata iz dva orginalana skupa G • Slično tome, za novi skup G najopćenitija generalizacija od [?,?] i [?,?] je {[?,?]}.
Emulacija algoritma eliminacije kandidata – drugi primjer • Prostor inačica za primjer: S = {[,]} i G = {[velika,?]; [?, poliedar]} • Za novi skup S uzmemo najspecifičniju generalizaciju od [mala,kocka] i [, ] koja je specifičnija od [?,?], [velika,?] i [?, poliedar]. Rezultat je {[mala, kocka]} • Za novi skup G najopćenitija specijalizacija od [?,?] i [velika,?] je {[velika, ?]}, a najopćenijita specijalizacija od [?,?] i [?,poliedar] je {[?,poliedar]}, ali [velika,?] nije općenitija od elementa [mala, kocka] pa se izbacuje iz skupa G • Novi skupovi su S = {[mala, kocka]} i G = {[?, poliedar]}
Emulacija algoritma eliminacije kandidata – treći i četvrti primjer • Prostor inačica za treći primjer: S = {[, ]} G = {[mala, ?]; [?,sfera]; [?,kocka]; [?,piramida]} • Spajanjm sa prethodnim prostorom inačica dobivamo S = {[mala, kocka]} i G = {[?,kocka]; [mala, poliedar]} • Prostor inačica za četvrti primjer: S={[mala, piramida]} i G = {[?,?]} • Konačan prostor inačica S=G={[mala, poliedar]}.