1 / 10

Reconocimiento Óptico de Caracteres

Utilería para digitalizar, generar OCR y crear archivos PDF de código abierto Luis René Salas López DanniHilton@gmail.com Coordinación de Automatización Bibliotecaria Xalapa. Reconocimiento Óptico de Caracteres. OCR. Los despido a todos. _ Estoy muy cansado… Quiero dormirme .

lita
Télécharger la présentation

Reconocimiento Óptico de Caracteres

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Utilería para digitalizar, generar OCR y crear archivos PDF de código abiertoLuis René Salas LópezDanniHilton@gmail.comCoordinación de Automatización BibliotecariaXalapa

  2. Reconocimiento Óptico de Caracteres OCR Los despido a todos. _Estoy muy cansado… Quiero dormirme. _¿No vas a merendar? _No. Tengo mucho sueño...

  3. Tesseract-OCR • Desarrollado por HP entre 1985 y 1994. • Nunca se usó en un producto HP. • Código liberado en 2005 y adoptado por Google. • Altamente portable • Reconoce más de 60 lenguajes.

  4. Creación del documento • Cuando se realiza el proceso de OCR sobre una imagen, podemos obtener un archivo con ubicación espacial del texto: hocr

  5. Creación del documento • hOcr2Pdf.NET Es una librería para convertir .hocrhtml producidos por el motor Tessract-OCR o Cuneiform en pdfbuscable. Liberado bajo licencia GNU General PublicLicenseversion 2 (GPLv2).

  6. Creación del documento • iTextSharp Es una librería compatible con C# de iText para java de código abierto para la creación y manipulación de archivos PDF. Liberado bajo licencia Affero GNU PublicLicense.

  7. Creación del documento

  8. Creación del PDF

  9. Capacidad de búsqueda

  10. Referencias • “hOcr2Pdf.NET”, consultada por Internet el 29 de Abril del 2013. Dirección de Internet: https://hocrtopdf.codeplex.com/ • “iTextSharp”, consultada por Internet el 29 de Abril del 2013. Dirección de Internet: http://sourceforge.net/projects/itextsharp/ • “Tesseract-OCR”, consultada por Internet el 29 de Abril del 2013. Dirección de Internet: https://code.google.com/p/tesseract-ocr/

More Related