500 likes | 641 Vues
Cap6. Recunoasterea formelor. Cap. 6. Recunoasterea formelor. Recunoasterea formelor = metode de clasificare a obiectelor in cadrul unei multimi Scopul m etod ei = determinarea clas ei din care face parte un obiect Cazuri :
E N D
Cap6. Recunoasterea formelor Cap. 6. Recunoasterea formelor • Recunoasterea formelor = metode de clasificarea obiectelor in cadrul unei multimi • Scopul metodei = determinarea clasei din care face parte un obiect • Cazuri: • Nr. de clase + caracterizarecunoscute a priori (obiecte etalon pt. fiecare clasa) • Gruparea obiectelor in clase in acelasi timp cu construirea claselor • Metode simple: compararea trasaturilor obiectelor extrase cu modele ce caracterizeazafiecare clasa • Recunoasterea formelor: clasificarea obiectelor si regiunilor cunostinte decizie
Cap. 6. Recunoasterea formelor 6.1. Reprezentarea cunostintelor Vederea artificiala cunostinte si reprezentarea acestora din IA Intelegerea unei probleme reprezentarea cunostintelor Reprezentarea cunostintelor (IA): - limbaje si gramatici formale; - predicate logice, reguli de productie - retele semantice, cadre Reprezentari de nivel scazut: trasaturi si descrieri Structuri de date pentru reprezentarea cunostintelor: liste, arbori, grafuri, tabele, multimi, retele, matrice, structuri ierarhizateetc. Reprezentarea = conventiisintactice si semantice descrierea obiectelor Sintaxa unei reprezentari: simboluri si moduri de aranjare Semantica: intelesul reprezentarilor prin simboluri si aranjamente de simboluri permise de sintaxa
Cap. 6. Recunoasterea formelor • Trasaturi, descrieri • Nu sunt reprezentari in sensul strict al cunostintelor • Descrierea = set de proprietati scalare ale obiecelor trasaturi • = vector al trasaturilor: marime de intrare pentru recunoasterea statistica • Exemplu: Aria marime; compactitatea circularitatea • x = [arie, compactitate] • Clase: - mic, mare • A1, C1 A2, C1 A2, C3- circular, necircular • Limbaje si gramatici • Descrierea prin trasaturi neadecvata pentru structura obiectului • Descrierea structurala primitive si relatii intre acestea • Forme simple pentru reprezentarea structurilor = lanturi (Freeman), arbori, grafuri • Descrierea clasei gramatici si limbaje: reguli pentru construirea lanturilor, arborilor si • grafurilor din primitive
Cap. 6 Recunoasterea formelor • Predicate logice • Predicate logice formalism matematic noi cunostinte din cele vechi prin deductii • matematice • Predicate logice: combinatii de - variabile logice (adevarat, fals) • - cuantificatori (, ) • - operatori logici (si, sau, negat, implica, echivalent) • Limbajul PROLOG predicate logice • Reguli de productie • Reguli de productie: reprezentarea cunostintelor prin “conditie - actiune” • “daca” X are loc “atunci” actiunea Y este potrivita • Cunostinte reprezentare prin actiunea potrivita la un anumit moment
Cap. 6. Recunoasterea formelor • Retele semantice • Retele semantice: reprezentari speciale ale structurilor de date relationale • Retele semantice= obiecte + descriere obiecte + relatii intre obiecte • Structura de date este reprezentata printr-un graf: nod = obiecte • arc = relatii intre obiecte • Formele logice ale cunostintelor retele semnatice • Predicatele logice reprezentarea/evaluarea informatiilor si cunostintelor locale • Cadre, scenarii • Cadre: metoda generala: inglobeaza toate metodele de reprezentare a cunostintelor • Cadre = scenarii (similare cu cele de film) • Cadrul “decolare - avion” start motoare • condu spre pista • tureaza motoarelecunostinte despre decolare • ruleaza si creste viteza • zboara • SVA informatii noi in conditii de vizibilitate scazuta
Cap. 6. Recunoasterea formelor 6.2. Recunoasterea statistica a formelor Obiect = unitate fizica intr-o imagine segmentata = regiune Multimea obiectelor submultimi disjuncte = clase (trasaturi comune) Recunoasterea obiectelor stabilirea claselor carora apartin obiectele = clasificare Clasificatorul clasa pe baza formei = proprietatile masurate ale obiectului Clasificatorul recunoaste forma si nu obiectul propriu-zis Recunoasterea formelor recunoasterea obiectelor Obiect Descriere Forma Clasificator Clasificare Descrierea obiectului cantitativ trasaturi (vectori) => recunoasterea statistica calitativ siruri, arbori => recunoasterea sintactica
x1 k3 * * * * x2 * * k1 k2 * * * Cap. 6 Recunoasterea formelor 6.2.1 Descrierea statistica (cantitativa) Forma (pattern) aranjament de trasaturi (descriptori) x1, x2, … , xn Clasa unei forme => familie de forme cu proprietati comune => clasele formelor ω1, ω2, …, ωR (R = nr. de clase) Vectorul formei(vectorul trasaturilor): x = [x1, x2, … , xn]T Multimea tuturor formelor X = spatiul formelor (trasaturilor) Clase = grupuri (clusters) in X separare prin curbe (hipersuprafete) de discriminare Recunoastere liniar separabila hipersuprafete hiperplane Clase separabile: fiecare forma va reprezenta numai obiecte ce formeaza o clasa
x1 ° x2 ° xn ° Clasificator statistic wr Cap. 6 Recunoasterea formelor 6.2.2Metoda deciziilor teoretice Clasificator statistic ωr wr: identificatorii claselor, r = 1, 2, …, R regula de decizie Regula de decizie X R multimi disjuncte Kr, Kr: multimea formelor x pentru care: Frontierele multimilor Kr : hipersuprafete Clasificator determinarea regulilor de decizie (determinarea hipersuprafetelor de discriminare)
Cap. 6 Recunoasterea formelor • Recunoasterea bazata pe metoda deciziilor teoretice: • => functii discriminant (de decizie) • functii discriminant pentru cele R clase cu proprietatea: • Hipersuprafete de discriminare intre Kr si Ks: • Regula de decizie: • Exemplu: functie discriminant liniara
Cap. 6 Recunoasterea formelor • 6.2.2.1 Matching • Fiecare clasa => vector prototip • X: R puncte v1, …, vR = vectori prototip (modele) pentru clasele w 1, …, w R • O forma necunoscutaapartine clasei celei mai apropiate (cu o metrica predefinita) • Tehnici de clasificare: • metoda distantei minime • metoda bazata pe corelatie
Cap. 6 Recunoasterea formelor • Metoda distantei minime • Vectorul prototip = media vectorilor unei clase => • Ns = nr. de forme din clasa Ks • Regula de decizie: (d => distanta euclidiana)
x2 vr Ks Kr x1 vs Cap. 6 Recunoasterea formelor Suprafata de discriminare intre clasele Krsi Ks: Suprafata de discriminare => perpendiculara pe mijlocul segmentului vrvs n = 2 => linie (vezi figura) n = 3 => plan n > 3 => hiperplan
Cap. 6 Recunoasterea formelor • Metoda bazata pe corelaţie • Fie două funcţii fşi w de dimensiuni M×N • convoluţia discretă: • corelaţia • f * complexul conjugat al lui f • Corelaţia matching • - f(x, y): imagine cu obiecte sau regiuni (MN) • - w(x, y): obiectul sau regiunea de recunoscut (JK) =>template = şablon, model • Găsirea regiunii w(x, y) în imagineaf(x, y)determinarea maximului funcţieide corelaţie
Cap. 6 Recunoasterea formelor Functia de corelatie: Functia de corelatie: sensibila la variatiile de amplitudine ale lui f si w Coeficientul de corelatie: : valoarea medie a lui w : valoarea medie a lui f in regiunea unde este localizat w
Cap. 6 Recunoasterea formelor • 6.2.2.2 Clasificarea statistica optima • Clasificator bazat pe functii discriminant deterministic daca forma x esteclasificata • ca apartinanad intotdeauna aceleiasi clase • Forma x poate reprezenta obiecte din clase diferite decizii incorecte • Micsorarea pierderilor datorate deciziilor incorecte => metode probabilistice de recunoastere • Clasificare optima => cea mai mica probabilitate de a rezulta erori de clasificare
Cap. 6 Recunoasterea formelor • Clasificatorul Bayes • Fie probabilitatea ca o forma particulara sa provina din clasa ωs • Lrs pierderea cauzata de atribuirea formei x clasei ωs cand de fapt apartine clasei ωr • Pierderea medie ce apare cand x este atribuit clasei ωr • riscul mediu conditionat • Probabilitati: (Bayes) • : densitatea de probabilitate a formelor din clasa ωs • : probabilitatea de aparitie a clasei ωs • : comun pentru
Cap. 6 Recunoasterea formelor Clasificatorul Bayesatribuie o forma x clasei ωr daca: sau: Functia de pierdere: cu densitatea de probabilitate mixta a celor R clase
Cap. 6 Recunoasterea formelor O forma apartine clasei ωr daca pentru s≠r functii discriminant Functia discriminant - optimala minimizeaza pierderile medii ale clasificarilor eronate - trebuie cunoscute: Daca toate clasele au aceeasi probabilitate de aparitie Functia de densitate de probabilitate - functia de n variabile, dificil de estimat - se considera forma analitica cunoscuta si se estimeaza parametrii folosind forme din fiecare clasa
Cap. 6 Recunoasterea formelor • Clasificatorul Bayes pentru clase de forme gaussiene • Se considera densitati gaussiene de probabilitate • x0 se deplaseaza
Cap. 6 Recunoasterea formelor b) Cazul n – dimensional unde: media vectorilor matricea de convarianta Er{} operatorul de mediere Operatorul de mediere valoarea medie estimari pentru mr si Cr pe baza unui numar finit Nr de forme din clasa ωr: Nota: Cr matrice simetrica si pozitiv semidefinita ckk:: varianta elementului k al vectorilor formei cjk: covarianta lui xj si xk cjk = 0: elementele xj si xk nu sunt corelate
Cap. 6 Recunoasterea formelor Densitatea gaussiana functia discriminant: ln Cazuri particulare: (i) (ii)
Cap. 6 Recunoasterea formelor (ii) functia discriminant pentru un clasificator de distanta minima Clasificatorul de distanta minima optim in sens Bayse daca: - clasele de forme sunt gaussiene - matricele de covarianta sunt egale cu matricea unitate - toate clasele au aceeasi verosimilitate de aparitie
Cap. 6 Recunoasterea formelor • 6.3. Recunoasterea sintactica a formelor • Descrierea cantitativa recunoasterea statistica • Descrierea calitativa prin relatii structurale • recunoasterea sintactica • Forma subforme primitive: structura ierarhica • Alegerea primitivelor: • - numar redus de primitive • - reprezentarea adecvata a obiectelor • - usor de extras din imaginea segmentata • - recunoastere statistica usoara a primitivelor • - corespondente cu elemente naturale
Analogie Cap. 6 Recunoasterea formelor 6.3. Recunoasterea sintactica a formelor Concatenare primitive - subforme - forme - structura ierarhica Concatenare litere - cuvinte - propozitii - sintaxa limbaj Descrierea structurii formei: primitive + relatii = limbaj de descriere a formei Gramatica limbajului: reguli => compunerea primitivelor in forme Etape: (i) identificare primitive si relatii posibile pentru forma analizata (ii) analiza sintactica a frazei (formei): corecta gramatical (iii) (ii) descriere structurala = sir, arbore
a a b b c b b c c b c b + c a c + b b + b + c + c a + a + b + b + c x L(G) x Reprezentare forma Analiza sintactica Forma segmentare extragere primitive Recunoastere Invatare G Analiza gramaticala Forme etalon Cap. 6 Recunoasterea formelor • Exemple: • Primitive • Relatii: concatenare = + • Forma propozitie: a + a + b + b + c + b + b + c + c • Reprezentare structura ierarhica sir sau arbore • Analiza sintactica pe baza unei gramatici: corectitudinea sintactica a propozitiei • Obtinerea gramaticilor pentru descrierea structurala a claselor de forme invatare Forma Subforma Primitive
Cap. 6 Recunoasterea formelor • 6.3.1 Gramatici si limbaje • 6.3.1.1 Definitii si conventii • Siruri • Alfabet → V = {a,b,c,..z,B,D}: multime nevida si finita de simboluri • Concatenarea simbolurilor: a◦b = ab • Sir (propozitie) peste V: un simbol din V sau o secventa de simboluri formata din concatenarea a zero sau mai multe simboluri • : sirurile se noteaza cu litere grecesti =>α, β • Exemple: α = aabc, β= cDBf, ω = a • Lungimea unui sir: n = | λ| • Un sir care contine de n ori un element: β = aaa..a = an • Sirul nul:ε(sauλ) → pentru orice sir ω→ ω◦ ε = ε◦ ω = ω |ε| = 0
Cap. 6 Recunoasterea formelor • Inchidere • → multimea tuturor sirurulor de lungime 2 obtinute din V • → multimea tuturor sirurulor de lungime 3 obtinute din V • → multimea tuturor sirurilor (propozitiilor) nevide produse de V • → inchiderea lui V • → inchiderea pozitiva a lui V • Limbaj • Definitie: O submultime de siruri L , unde: • se numeste limbaj.
Cap. 6 Recunoasterea formelor • Operatii cu limbaje • Se dau doua limbaje peste alfabetul V : • Reuniunea: • Concatenarea: • Iteratia: • Pentru sirurile , sirul β este subsir al lui α daca V* contine sirurile γ si μ • astfel incat: α = γβμ
Cap. 6 Recunoasterea formelor • Gramatici • O gramatica consta din urmatoarele patru entitati: • VT: multimea simbolurilor terminale → a, b, d (terminale sau primitive – litere mici ale alfabetului latin) • VN : multimea simbolurilor neterminale → A, B, S (variabile - litere mari ale alfabetului latin) • P : multimea regulilor de productie (productii) • productiile au forma: • S : simbolul de start; • Gramatica G se exprima prin cvadruplul:
Cap. 6 Recunoasterea formelor • Limbaje bazate pe gramatici • Orice submultime se numeste limbaj • |L| finit = limbajul este numit finit • Limbajul generat de gramatica , notat L(G), = multimea tuturor sirurilor care satisfac restrictiile: • (i) fiecare sir este format numai din simboluri terminale • (ii) fiecare sir este produs pornind de la S utilizand P • Generarea directa a sirurilor • - un sir η genereaza direct un alt sir γ daca: • Generarea (producerea) sirurilor • - un sir η genereaza un alt sir γ daca exista o secventa de siruri: • Limbajul generat de gramatica G este:
Cap. 6 Recunoasterea formelor • 6.3.1.2 Tipuri de gramatici • Fiind date VT si VN, productiile P pot fi interpretate ca mapari • Diferite tipuri de gramatici impun restrictii acestor mapari • Intr-o gramatica G, restrictiile se exprima considerand forma generala a unei productii: • , adica sirul βeste inlocuit de sirul ω • Tipuri de gramatici (Chomsky – 1957): • ► T0 (tip 0 – fara restrictii) • - nu sunt restrictii privind rescrierea productiilor • ►T1 (tip 1 – sensibila la context) • - in gramatica T1, productia are urmatoarele restrictii: • - productiile cu restrictii au forma:
Cap. 6 Recunoasterea formelor • ► T2(tip 2 – libera de context: CFG = Context Free Grammar) • - productia este de forma: • - restrictiile pentru productii sunt: • : α1 trebuie sa fie un singur simbol neterminal pt. orice productie in P • Exemple: • Se da gramatica de tip T2: • GCFG genereaza limbajul:
Cap. 6 Recunoasterea formelor • Rezultate tipice: • in ultimul sir nu mai sunt variabile => procedura se incheie • un patrat cu laturile paralele cu axele de coordonate si de lungime 2 • primitive de lungime 1: d b a c Descrierea patratului:
Cap. 6 Recunoasterea formelor ► T3(tip 3 – de stare finita: FSG = Finite State Grammar sau regulata) Restrictiile pentru productii sunt: • Reprezentarea grafica a gramaticilor de stare finita FSG • Reguli de reprezentare grafica: • Nodurile, cu o exceptie, corespund elementelor din VN; se foloseste un nod terminal T • Pentru fiecare productie Ai→ aAj, exista un arc de la nodul Ai catre nodul Aj • etichetat cu a • 3. Pentru fiecare productie Ai → a, exista un arc de la nodul Ai catre nodul T • etichetat cu a
Cap. 6 Recunoasterea formelor • Exemplu: reprezentarea grafica a unei gramatici Se considera gramatica FSG: Graful corespunzator gramaticii =>
Cap. 6 Recunoasterea formelor • 6.3.2 Recunoasterea sintactica a sirurilor • Elemente: • multimea primitivelor formei • multimea regulilor (gramatica) ce stabilesc modul de interconectare a primitivelor • automatul finit folosit pentru recunoastere, cu structura determinata de multimea regulilor din gramatica
Cap. 6 Recunoasterea formelor 6.3.2.1 Gramatica sirurilor genereaza forme siruri (propozitii) multimea propozitiilor generate cu G Exemplul 6.3.1. Sa se determine o gramatica G care sa permita descrierea formei din figura folosind primitivele a, b si c.
Cap. 6 Recunoasterea formelor • 6.3.2.2 Recunoasterea sirurilor cu automate finite • automat finit • Q: multimea finita, nevida a starilor • : alfabet finit de intrare • mapare din multimea ordonata a perechilor Q× • in colectia tuturor submultimilor Q • q0: starea de start • FQ: submultimea starilor finale (acceptate) • Un automat recunoaste un sir de simboluri terminale daca: • porneste scanarea sirului de la stanga la dreapta incepand cu starea de start q0 • la finalul sacnarii, dupa ultimul simbol, se ajunge in starea finala
Cap. 6 Recunoasterea formelor Exemplul 6.3.2 Se considera automatul: Reprezentarea grafica a diagramei starilor: Automatul: recunoaste sirul => rejecteaza sirul =>
Cap. 6 Recunoasterea formelor • Un limbaj este recunoscut de un automat daca si numai daca este generat de o gramatica FSG (regulata) • Proiectarea unui automat • Fie gramatica: • unde si • Formarea multimii Q a automatului • n + 2 stari: • qn+1 starea finala • maparile doua reguli bazate pe P G pentru fiecare i, j, • Daca este in P, atunci contine qj • Daca este in P, atunci contine qn+1
Cap. 6 Recunoasterea formelor • Se da automatul gramatatica FSG (regulata) • - Gramatica regulata corespunzatoare: • VN elementele din Q cu • regulile de productie: • Daca qj este in , exista o productie in P • Daca o stare in F este in , exista o productie in P • VT =
q q 0 3 c a b q q 1 2 Cap. 6 Recunoasterea formelor • Exemplul 6.3.3 • Pentru gramatica de la Exemplul 6.3.1 sa se construiasca un automat pentru recunoasterea formelor si sa se reprezinte diagrama starilor
Cap. 6 Recunoasterea formelor • 6.3.3 Recunoasterea sintactica a arborilor • 6.3.3.1 Descriptori pentru arbori • Arborele T o multime de noduri cu proprietatile: • exista un nod unic $ desemnat drept radacina • celelalte noduri sunt impartite in m multimi disjuncte de arbori T1, T2, …,Tm, fiecare fiind un subarbore al lui T • Frontiera arborelui: multimea nodurilor din partea inferioara a arborelui (frunze) luate in ordine de la stanga la dreapta
Cap. 6 Recunoasterea formelor • 6.3.3.2 Gramatica arborilor • VN: multimea simbolurilor neterminale: X1, X2, …, Xn si S ( simbolul de start) • VT: multimea simbolurilor terminale: k, ab, … • P: multimea productiilor de forme • r: functia rang: numarul descendentilor unui nod a caror eticheta este un simbol terminal • Gramatica expansiva • Regula de productie:
Cap. 6 Recunoasterea formelor Exemplul 6.3.4 Gramatica arborelui pentru generarea scheletului din figura
Cap. 6 Recunoasterea formelor 6.3.3.3 Automat finit pentru recunoasterea arborilor Automate pentru arbore simultan din fiecare nod al frontierei se continua pe cai paralele spre radacina Automat: frontiera spre radacina Q: multimea finita a starilor F: multimea starilor finale (submultime a lui Q) fk: relatie in Qm× Q astfel incat m este rangul lui k
Cap. 6 Recunoasterea formelor • Gramatica expansiva pentru arbori: • Automat finit pentru recunoastere: • Q = VN cu F = {S} • a VT se defineste o relatie fk astfel incat {X1, X2, …, Xm , X} este in fk daca si numai daca in G exista o productie:
Cap. 6 Recunoasterea formelor • Exemplul 6.3.5. • Se considera gramatica pentru arbori • cu: • Sa se determine automatul corespunzator acestei gramatici • Considerand arborele din figura sa se arate cum se realizeaza recunoasterea.
Cap. 6 Recunoasterea formelor fa => nodului a, fara urmasi (Φ), i se atribuie starea X fc => nodului c, cu un urmas avand starea X, i se atribuie starea X fd => nodului d, cu doi urmasi, fiecare avand starea X, i se atribuie starea X
Cap. 6 Recunoasterea formelor (i) (i) – se atribuie stari nodurilor frontierei a si b prin fa si fb: starea X este atribuita celor doua frunze (ii) (ii) – automatul se muta la nivelul urmator si atribuie starea X nodului c pe baza lui fc si a starii urmasului (iii) (iii) – la urmatorul nivel automat gaseste in nodul d cu urmasii avand starile atribuite; relatia fdpermite atribuirea starii S nodului d - d este ultimul nod si S este in F arborele a fost recunoscut