1 / 41

Diplomski rad

Primjena konturnih deskriptora u pretraživanju baza slika. Diplomski rad. Kandidat: Jelena Đuričić. Mentor: prof. dr Zdenka Babić. 1. UVOD. Digitalna slika . predstavlja se dvodimenzionalnom matricom kvantovanih vrijednosti. Na porast primjene uticale su:.

morpheus
Télécharger la présentation

Diplomski rad

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Primjena konturnih deskriptora u pretraživanju baza slika Diplomski rad Kandidat: Jelena Đuričić Mentor: prof. dr Zdenka Babić

  2. 1. UVOD Digitalna slika predstavlja se dvodimenzionalnom matricom kvantovanih vrijednosti Na porast primjene uticale su: • tehnike kompresije i memorijski uređaji • rezolucija video displeja • kvalitetni uređaji: skeneri, digitalne kamere, specijalizovani digitalni uređaji Oblasti primjene: • daljinske senzorske slike • naftna istraživanja • astronomija • biometrička identifikacija • medicina

  3. 1. UVOD Većina primjena zahtjeva efikasno pronalaženje slika unutar baza (kolekcija) slika. Definisanje sadržaja slika? Slike ne sadrže jednoznačno definisane informacije - svaki posmatrač može ih različito opisati Definisanje sadržaja slike = indeksiranje ili reprezentacija sadržaja Content Base Image Retrieval CBIR = Tehnike koje nastoje da automatski indeksiraju vizuelna obilježja

  4. 2. PRONALAŽENJE SLIKA NA OSNOVU OBLIKA CBIR tehnike automatski izdvajaju osnovna vizuelna obilježja (boja, tekstura, oblika) i na osnovu njih formiraju deskriptore Konturna deskripcija = opisivanje oblika objekta na slici preko njegove konture Broj tačaka konture zavisi od: • složenosti oblika • veličine slike • rezolucije slike Da bi mogli porediti dva objekta konture moraju imati isti broj tačaka

  5. 2.4. SIGNATURE OBLIKA Signatura oblika= jednodimenzionalna funkcija koja predstavlja dvodimenzionalnu konturu Kompleksne koordinate

  6. 2.4. SIGNATURE OBLIKA 2. Centroidna distanca

  7. 2.4. SIGNATURE OBLIKA 3. Kurvatura diskontinuiteti

  8. 2.4. SIGNATURE OBLIKA 4. Kumulativna ugaona funkcija

  9. 2.5. MJERE SLIČNOSTI Euklidova distanca Preciznost i odziv • D - ukupan broj relevantnih slika • A - ukupno izdvojeno slika • C- ukupno tačnih slika Broj slika u klasi – 12 D=12 Broj izdvojenih slika upitom -10 A=10 Broj tačnih slika – 5 C=5

  10. 3. FOURIEROVI DESKRIPTORI Fourierova transformacija (FT) predstavlja signal sumom kompleksnih eksponencijalnih funkcija U diskretnom prostoru definiše se Diskretna Fourierova transformacija (DFT) jednodimenzionalna kompleksna funkcija, koja predstavlja signaturu konture Koeficijente ,n=0, 1, ... , N-1, dobijene DFT signature oblika nazivamo Fourierovim deskriptorima (FD) konture

  11. 3. FOURIEROVI DESKRIPTORI Fourierovi deskriptori su kompleksne vrijednosti – predstavljamo ih magnitudom i fazom

  12. 3.3 OSOBINE FD Translacija Skaliranje Rotacija, početna tačka

  13. 4. WAVELET DESKRIPTORI FT nam govori da li se određena frekvencijska komponenta pojavljuje u signalu, ali ne i kada se ta komponenta javlja Kontinualna wavelet transformacaija (CWT) : Diskretna wavelet transformacija (DWT):

  14. 4.2.1 DEKOMPOZICIJA SIGNALA WT Wavelet dekompozicija signala, u svakom koraku, signal razdvaja na NF i VF komponentu detalji aproksimacija Koeficijente dobijene DWT signature oblika zovemo Wavelet deskriptorima (WD) konture

  15. 4.3. OSOBINE WD Translacija Rotacija Skaliranje

  16. PRIMJER PRETRAŽIVANJA BAZE SLIKA

  17. 5. STATISTIČKA EVALUACIJA KONTURNIH DESKRIPTORA Baza slika = 18 klasa sa po 12 objekata = 216 slika • Mjera sličnosti = Euklidova distanca • Svaka slika = jedan upit • Svaki upit za 4 vrijednosti parametra • Za svaki upit i svaki parametar određen je • maksimalni opseg Euklidovih distanci • kao i srednje vrijednosti za: • odziv • preciznost za pet izdvojenih slika • klasa prve izdvojene slike P(1) • redni broj prve relevantne slike

  18. 5.3. STATISTIČKA EVALUACIJA FD Efikasnost FD I kategorija: camel (4) • rezultati najlošiji. • slike međusobno najrazličitije • mnogo izraženih frekvencijskih komponenti

  19. 5.3. STATISTIČKA EVALUACIJA FD II kategorija: ray (17), misk (16), hammer (13), elephant (8), bird (1), heart (14), key (9), turtle(18) Greške nastaju zbog deskriptora iste frekvencijske komponente = vizuelno različite stvari (a) UPIT (b) 4. POGODAK (c) 27. POGODAK

  20. 5.3. STATISTIČKA EVALUACIJA FD III kategorija: brick (3), car (5), classic (7) Greške u pretraživanju nastaju zbog vizuelnih sličnosti Klasa BRICK Klasa CLASSIC Klasa CAR IV kategorija: fountain (11), glass (12), fork (19), bone(3), face(9), children (6) • pretraživanje ima veliku prceciznost • greške zbog zbog velikih razlika modela od ostalih slika u klasi

  21. 5.3.1 PROMJENA SIGNATURA

  22. 5.3.1 PROMJENA SIGNATURA Klase bird (1), brick (3) i turtle (18) centroidna distanca manje naglasila debljinu objekta u odnosu na kompleksne koordinate (a) UPIT (b) 31.POGODAK ZA KOMPLEKSNE KOORDINATE 7. POGODAK ZA CENTROIDNU DISTANCU

  23. 5.3.1 PROMJENA SIGNATURA Klase heart (14) i misk (16) • posljedica naglašavanja krivine koja je bliska centru objekta (a) UPIT (b) 47. POGODAK

  24. 5.3.1 PROMJENA SIGNATURA Kurvatura je najlošija signatura Očekivano s obzirom na njene nedostatke u vidu diskontinuiteta Kumulativna ugaona funkcija - nije dala dobre rezultate, ali je bolja od kurvature Izuzetak: klase face (9) i key (15). Slike ovih klasa nemaju mnogo ravnih linija na konturama pa je manji broj diskontinuiteta u kurvaturi, što doprinosti boljoj deskripciji. Klasa Face: 2 diskontinuiteta Klasa Brick: 18 diskontinuiteta

  25. 5.3.2 PROMJENA BROJA TAČAKA Promjena broja tačaka nema značajnijeg uticaja na efikasnost deskriptora

  26. 5.3.2 PROMJENA BROJA TAČAKA Nedostatak javlja se i kod vizuelno sličnih klasa  povećanje broja tačaka više naglašava detalje koji postaju dominanti u odnosu na ukupnu sliku (a)UPIT KLASA - CLASSIC (b) 24. POGODAK ZA 128 TAČAKA; 12. POGODAK ZA 256. TAČAKA KLASA - CAR (c) 11. POGODAK ZA 128 TAČAKA; 19. POGODAK ZA 256. TAČAKA KLASA - CLASSIC povećanje broja tačaka utiče na brzinu rada  povećanje broja tačaka neefikasno.

  27. 5.3.3 PROMJENA BROJA DESKRIPTORA

  28. 5.3.3 PROMJENA BROJA DESKRIPTORA 32 FD 64 FD (a) UPIT 1. 2 3.

  29. 5.4. STATISTIČKA EVALUACIJA WD I kategorija: children (6), face (9), fork(10), glas (12), brick (3) Klase imaju dobre rezultate (80-100%) za usvojene kriterije sličnosti jer ne sadrže mnogo značajnih VF komponenti II kategorija: bone (2), hammer (13), key (15), misk (16) Greške deskriptora – nagle promjene konture imaju preveliku težinu u odnosu na objekat III kategorija: car (5), classic (7), heart (14), turtle (18), rey (17) Vizuelna sličnost: greške nastaju mješanjem vizuelno sličnih klasa IV kategorija: fountain (11), elephant (8), bird (1), rey (17), car (5), turtle (3), classic (7) Greške rotacije: greške nastaju zbog pogrešnog izbora početne tačke

  30. 5.4.1. PROMJENA SIGNATURA

  31. 5.4.1. PROMJENA SIGNATURA Bolje rezultate centroidna distanca za klase bird(1) elephatnt (8) i fountain(11) • manja osjetljivost na pročetnu tačku tj. na rotaciju • centroidna distanca manje naglašava debljinu objekta (a) UPIT (b) 61. POGODAK ZA KOMPLEKSNE KOORDINATE 2. POGODAK ZA CENTROIDNU DISTANCU • Razlika aproksimacija za kompleksne koordinate 1822 • Razlika aproksimacija za centroidnu distancu 522

  32. 5.4.1. PROMJENA SIGNATURA Značajno lošije rezultate centroidna distanca dala je za klase bone(2), brick (3), face(9) i key (15) ravnomjerne konture VF komponenti unose velika odstupanja (a) UPIT (b) 11. POGODAK ZA KOMPLEKSNE KOORDINATE 21. POGODAK ZA CENTROIDNU DISTANCU

  33. 5.4.1. PROMJENA SIGNATURA Kumulativna ugaona funkcija dala je najbolje rezultate u klasama camel (4), car (5), elephant (8) i glas (12) (a) UPIT (b) 53. POGODAK ZA KOMPLEKSNE KOORDINATE 12. POGODAK ZA KUMULATIVNU UGAONU FUNKCIJU

  34. 5.4.2. PROMJENA BROJA TAČAKA

  35. 5.4.2. PROMJENA BROJA TAČAKA • veliki broj tačaka znači da konture imaju veliki broj detalja • promjena broja tačaka mjenja i broj tačaka u pojedinim nivoima dekompozicije • poseban uticaj ima povećanje broja tačaka aproksimacije: za mali broj tačaka dolazi do mješanja klasa koje su vizuelno slične vizuelna sličnost znači i sličnost aproksimacije

  36. 5.4.3. PROMJENA REDA DEKOMPOZICIJE

  37. 5.4.3. PROMJENA REDA DEKOMPOZICIJE Klasa camel(4) • dolazi do povećanja efikasnosti sa povećanjem reda • ove slike međusobno dosta različite pa sa povećanjem reda veća težina daće se detaljima što u ovom slučaju ima pozitivan uticaj 6. red dekompozicije 8. red dekompozicije

  38. 6. ZAKLJUČAK • Eksperimentalni rezultati FD • lošiji kod kontura sa većim brojem izraženih spektralnih komponenti • zamjena vizuelno različitih oblika koji imaju iste spektrale komponente • Promjena signatura: • kompleksne koordinate pokazale su se kao najbolja signatura. • centroidna distanca značajno neutrališe debljinu objekta, ali i previše naglašava promjene položaja konture u blizini centroida objekta • Promjena broja tačaka • povećanje broja tačaka znači poboljšanje deskripcije, iako zanemarljivo malo (0,1 %do 1%), ali uz značajan gubitak na vremenu izračunavanja • Promjena broja deskriptora • povećanje broja FD iznad 64 neće značajno doprinjeti kvalitetu

  39. 6. ZAKLJUČAK • Eksperimentalni rezultati WD • ne postoje velike oscilacije među klasama • ne postoji mješanje frekvencijskih komponenti • Promjena signatura: • kompleksne koordinate su najbolja signatura • centroidna distanca djelimično neutrališe rotaciju, ali nedovoljno opisuje objekte blagih kontura • kumulativna ugaona funkcija daje znatno bolje rezultate za WD u odnosu na FD • Promjena broja tačaka: • povećanje broja tačaka iznad 256 daje lošije rezultate • Promjena reda dekompozicije • mjenjamo odnos NF i VF komponenti u deskriptorima

  40. 6. ZAKLJUČAK • Rezultati su dobijeni primjenom Euklidove distance kao mjere sličnosti • Bolji rezultati mogu se dobiti primjenom nekih složenijih funkcija • Progami za pretraživanje sve više koriste metode interaktivnog i iterativnog pretraživanja • Još jedan od načina za poboljšanje CBIR sistema je upotreba tekstualnih anotacija i meta-fajlova • Pretraživanje baza slika je oblast koja se sve više istražuje i razvija

  41. HVALA

More Related