1 / 14

OCR

OCR. (Optical Character Recognition). Vypracovali: P. Vymetálek, J. Viktora Kartografická polygrafie a reprografie akademického roku 2007/2008. Co nás čeká. úvod historie metody ocr jak funguje. Úvod. OCR - Optical Character Recognition = optické rozpoznávání znaků

Télécharger la présentation

OCR

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. OCR (Optical Character Recognition) Vypracovali: P. Vymetálek, J. Viktora Kartografická polygrafie a reprografie akademického roku 2007/2008

  2. Co nás čeká • úvod • historie • metody ocr • jak funguje

  3. Úvod OCR - Optical Character Recognition = optické rozpoznávání znaků • umožňuje digitalizaci tištěných textů • úspěšnost převodu je závislá na kvalitě předlohy • je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních, jehličkových tiskáren a předlohy vytištěné knihtiskem

  4. Historie • 1950 – začátek vývoje ocr • 1954 – první OCR systém – Reader‘s Digest První generace OCR: • 1960 – 1965 • charakterizuje se využitím pro jednoduché zpracování znaků • znaky byly speciálně vyvinuty pro tyto systémy

  5. Historie • znaky vypadali značně uměle • postupně systémy s více fonty • systém porovnával znaky s knihovnou znaků E13B

  6. Historie Druhá generace OCR: • pol. 60. let až 70. léta • rozpoznání běžně psaných strojových textů • „rozpoznání“ ručně psaných znaků • první systémy – IBM1287, Toshiba (poštovní třídič), Hitashi • americký standard character set OCR-A • evropský standard character set OCR-B

  7. Historie OCR – A OCR - B

  8. Historie Třetí generace OCR: • od poloviny 70. let • rozpoznávají dokumenty nižší kvality OCR dneška: • masové nasazení a velké rozšíření různých systémů po cele Zemi • jmenujme: Fine Reader, …

  9. Metody OCR • principem modelu rozpoznávání je naučit systém základním případům • základní typy: speciální symboly, otazník, čárka,… • učení systému na demo datech • systém si vyrobí prototypy • při rozpoznávání se porovnávají znaky s prototypy

  10. Jak funguje • nejprve skenování podkladů

  11. Jak funguje • předzpracování, binární obraz • lokalizace řádků, znaků

  12. Jak funguje • extrahování rysů – získání základních charakteristik každého znaku

  13. Jak funguje • klasifikace znaků – rozpoznávání • porovnávání vzniklých slov se slovníkem • kontrola pravopisu -extrahování rysů-

  14. Zdroje • http://cs.wikipedia.org/wiki-OCR [online] • http://www.quido.cz/Objevy/ocr.htm [online] • http://medard.soc.cas.cz/digidat/obraz_OCR.htm [online] • http://www.digineff.cz/jaknato/ocr/ocr.html [online] • V.Suchý, Rozpoznávání textu v obraze, Brno 2007

More Related