1 / 26

Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos

Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos. Prof. Carlos H. Marcondes marcon@vm.uff.br. Arquivos em formato “mapa de bits”:. ARQUIVOS “MAPA-DE-BITS – “BIT MAP”. Arquivos em formato “mapa de bits”: como reconhecer um caracter?.

craig
Télécharger la présentation

Automação de Arquivos Gerenciamento Eletrônico de imagens de documentos

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Automação de ArquivosGerenciamento Eletrônico de imagens de documentos Prof. Carlos H. Marcondes marcon@vm.uff.br

  2. Arquivos em formato “mapa de bits”:

  3. ARQUIVOS “MAPA-DE-BITS – “BIT MAP”

  4. Arquivos em formato “mapa de bits”: como reconhecer um caracter? A a A a Aa a a A ? ? ? ? ?

  5. Processo de digitalização • Os sistemas de gerenciamento de imagens eletrônicas de documentos associam a cada arquivo de imagem, um registro de uma base de dados com conteúdos textuais codificados, para fins de busca/recuperação de informações Tipo | Num. | Setor | Data | Assunto |

  6. Processo de digitalização A digitalização é o processo de transformar documentos em papel em arquivos digitais de imagem tipo ¨mapa-de-bits¨ Nos arquivos de imagem tipo “mapa-de-bits” cada ponto de um documento, cada ponto de cada caracter de um documento é desenhado e não representado por um código como no conjunto de caracteres ASCII

  7. Vantagens do Gerenciamento Eletrônico de Imagens de Documentos Maior “densidade” de informações por unidade de armazenamento: um CD-ROM pode conter cerca de 40.000 folhas de papel A4 digitalizadas a 300 dpi As imagens de documentos podem ser acessadas através de redes, dispensando o acesso ao documento original Isso ajuda a preservar os documentos originais

  8. Processo de digitalização Imagens são formadas por pontos Pontos são representados por um número X de “bits” Bitonal ou preto-e-branco: 1 bit por ponto: pontos pretos: “1” pontos brancos: “0” Monocromático: preto-e-branco com diversas intensidades – 4 bits, 6 bits, 8 bits, por ponto) Colorido 8 bits por ponto: 256 cores 12 bits por ponto : 4096 cores 24 bits por ponto : 16.800.000 cores (“true color”)

  9. Processo de digitalização - RESOLUÇÃO • Relação entre número de pontos de uma imagem / Área • Unidade: “dpi” (“dots per inch”) pontos por polegada quadrada • A resolução é uma medida da LEGIBILIDADE de uma imagem

  10. Processo de digitalização - RESOLUÇÃO • Corresponde à capacidade de detalhamento de uma imagem, quanto maior a resolução da imagem, maior será a sua capacidade de exibir detalhes.

  11. Processo de digitalização RESOLUÇÃO - aplicação da digitalização em DOCUMENTOS Arquivos de imagens ( de documentos) com baixa resolução são POUCO LEGÍVEIS (abaixo de 50 dpi) Acima de 800 dpi a vista humana NÃO DISTINGUE MAIS MELHORAS DE LEGIBILIDADE Quanto maior a resolução de uma imagem, maior o tamanho do arquivo que vai armazena-la Resolução razoável para documentos: 300 dpi

  12. Processo de digitalização • Como não existe um código único para cada caracter, Aa Aa Aa aa A a, • nos arquivos “mapa-de-bits” não é possível fazer busca por conteúdo

  13. Processo de digitalização - Etapas • Preparação - desarquivamento, retirada de grampos e “clips” restauração, agrupamento em lotes para a digitalização. • Fatores críticos de sucesso • o estado dos documentos • uniformidade dos documentos • critério de grupamento em lotes

  14. Processo de digitalização - Etapas • Digitalização - alimentação e digitalização dos lotes no escaner • Os fatores críticos de sucesso desta etapa são • velocidade do escaner • cores da imagem: preto-e-branco, colorido, tons-de-cinza, • uniformidade dos lotes, evitando interrupção e re-ajustamento do escaner • resolução utilizada • Conferência - exame das imagens geradas para controle de qualidade, agrupamento de imagens formando documentos, eventualmente re-escaneamento

  15. Processo de digitalização - Etapas • Indexação - associação a cada arquivo de imagem ou a cada grupo de imagens que formam um documento, um conjunto de termos de indexação visando a recuperação da(s) imagem(ns) do documento digitalizado • Fatores críticos de sucesso desta etapa são • facilidade/velocidade de extração dos termos de indexação a partir da imagem do documento • padronização do “lay-out” do documento

  16. Processo de digitalização - “hardware” e “software” envolvidos • Hardware • escaner: de mesa, com bandeja • gravador de CD-ROM • “Jukebox”: dispositivo leitor com capacidade de 8 a 48 CD-ROMs, geralmente com 4 a 8 cabeçotes de leitura

  17. Digitalização – componentes de “hardware” Gravador CD “Software” de GED escaner “Jukebox” Estações p. consulta Impressora Sistema COM

  18. O escaner – características técnicas Fonte de luz Documento Sensor – matriz de fotocélulas (resolução de “hardware”)

  19. O escaner – características técnicas • Alimentador de folhas – capacidade (no. Folhas, peso • Tipo de interface • Resolução máxima por hardware: resolução real do sensor do escaner em dpi • Resolução interpolada: resolução obtida através de software • Modo de digitalização: simplex (uma face) ou duplex (ambas as faces) • Velocidade: em páginas (ppm) por minuto, num determinado modo e numa determinada resolução • Tamanho dos documentos: capacidade de receber folhas de papel em formatos An

  20. O escaner

  21. “JUKEBOX” – características técnicas “Vitrola” robótica capaz de disponibilizar um grande número de CDs gravados com imagens de documentos • Características: • Capacidade de armazenamento em GB • Número de discos • Número de leitores de discos • Tempo de troca de discos

  22. SISTEMAS COM– características técnicas “Computer Output on MicroFiche – permite a saída de relatórios diretamente em microfichas

  23. “Software” FUNÇÕES entrada: Escaneamento Conferência Indexação Gravação saída: - recuperação pelos pontos de acesso estabelecidos na indexação Processo de digitalização - “hardware” e “software” envolvidos

  24. Baseados em SGBDs usam “representações” de documentos; permitem armazenar e recuperar “representações” de documentos. Sistemas de Gerenciamento de Imagens de Documentos – GED permitem associar a “representações” de documentos imagens digitais desses documentos Sistemas de gerenciamento de fluxo de trabalho – “workflow” Permitem controlar o ciclo de vida de documentos – sua tramitação Sistemas de Gestão Documentos

  25. Processo de digitalização - OCR • “Optical Character Recognition” - Reconhecimento ótico de caracteres: processo de submeter uma arquivo de imagens .bitmap a um software especial, que reconhece as imagens dos caracteres e transforma a imagem de cada caracter no seu equivalente codificado (p.ex. em ASCII) • Vantagem : um arquivo textual codificado pode ser objeto de busca por conteúdo Arquivo “bitmap Arquivo codificado

More Related