1 / 5

Načítání captcha do matice pixelů

Načítání captcha do matice pixelů. Honza Helán, Tomáš Orálek, David Sochora. Popis problému. Načítání captcha (obrázek = 4 číslice) do matice pixelů, reprezentující každé číslo z obrázku. Cílem je zrychlit ořezání jednotlivých číslic a jejich následné načtení do matice v daný čas.

Télécharger la présentation

Načítání captcha do matice pixelů

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Načítání captcha do matice pixelů Honza Helán, Tomáš Orálek, David Sochora

  2. Popis problému • Načítání captcha (obrázek = 4 číslice) do matice pixelů, reprezentující každé číslo z obrázku. • Cílem je zrychlit ořezání jednotlivých číslic a jejich následné načtení do matice v daný čas. • Program nejdříve ořeže číslice vertikálně a poté horizontálně. • V dalším kroku se každé číslo uloží do řádku (vektoru) matice jako posloupnost bílých a černých pixelů (0 a 1, může sloužit jako vstup pro neuronovou síť, při lámání captcha).

  3. Postup řešení • Dekompozice úlohy • načtení captcha (rozměry 140x40, nebude se paralelizovat) • ořezání captcha (každé číslo rozměry 21x35, paralelizace) • načtení do matice (rozměry 735x 2000, paralelizace) • Dekompozice dat • paralelizovaná část bude pracovat s celými captcha kódy (n1 = 500) a následně s jednotlivými čísly (n2 = 2000)

  4. Postup řešení • Synchronizace • Použití synchronizačního vzoru „Bariéra“ • Každé části (ořezávání a načítání) budou přidělena 4 vlákna • Všechna 4 vlákna musí po ořezání počkat na poslední z nich • Po příchodu posledního vlákna se výsledná matice uloží jako .csv • V cyklu se bude opakovat pro každý captcha obrázek • Škálovatelnost • Při použití více procesorů je možnost znásobit počet vláken

  5. Děkujeme za pozornost.

More Related