1 / 67

Bibliotecas Digitales Distribuidas

Bibliotecas Digitales Distribuidas. Ing. Jorge Alexander Romano S. División de Sistemas UFPS Ocaña. Hoy en día existe una gran cantidad de conocimiento e información disponible.

iain
Télécharger la présentation

Bibliotecas Digitales Distribuidas

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bibliotecas Digitales Distribuidas Ing. Jorge Alexander Romano S.División de Sistemas UFPS Ocaña

  2. Hoy en día existe una gran cantidad de conocimiento e información disponible. • El gran reto es poder accesar ese conocimiento de una manera rápida y eficiente para obtener la información relevante que se pueda aplicar en la solución de problemas. • Las bibliotecas han sido tradicionalmente los repositorios de la sabiduría acumulada de la humanidad, desde los tiempos de la famosa biblioteca de Alejandría (año 48 a.C.), que contaba con más de 500,000 volúmenes (24 rollos de papiro equivalían a un volumen) hasta nuestros días en que contamos con bibliotecas como la Biblioteca del Congreso de los Estados Unidos con 23 millones de volúmenes.

  3. Actualmente, la mayoría de las bibliotecas cuentan con sistemas de cómputo para facilitar la búsqueda de información en un servicio conocido como catálogo electrónico. Algunas bibliotecas han tratado de ir más allá, y cuentan con una cantidad considerable de material en formato digital. • Una biblioteca digital es una colección organizada de documentos almacenados en formato digital que a su vez ofrece los servicios de búsqueda y recuperación de información.

  4. Es decir, si el documento es texto, la búsqueda se realiza sobre el texto completo del documento y una vez localizado el documento deseado es posible obtenerlo de manera inmediata. Esto contrasta con los sistemas tradicionales que se concentran solamente en búsquedas basadas en el titulo, descripción o palabras clave. • Los documentos que se encuentran en una biblioteca digital pueden ser texto, imágenes, video o combinaciones de los anteriores. Idealmente se deben de almacenar y poder recuperar documentos completos, y las búsquedas se realizan sobre el contenido completo de los documentos.

  5. E l término 'biblioteca digital' ha sido utilizado en la última década para referirse a una amplia gama de ocurrencias desde servicios bibliotecarios en línea hasta acervos de material digitalizado. En ocasiones los términos biblioteca electrónica, digital y/o virtual se utilizan indiscriminadamente. • El debate acerca de la definición exacta y el alcance de la biblioteca digital continúa.

  6. Existen muchos retos tecnológicos para poder llegar a contar con una implantación completa de una herramienta que cumpla todas las características deseables de una biblioteca. digital ya que la herramienta debe contemplar los siguientes aspectos: • Captura de información • Almacenamiento • Clasificación e indexamiento

  7. Facilidades para buscar, filtrar y resumir grandes volúmenes de datos, imágenes e información • Interfaces para la presentación de resultados • Distribución del contenido de la biblioteca al usuario final • Administración y control de acceso

  8. Objetivos de las Bibliotecas Digitales • Poner grandes fuentes de información en formato digital de manera que pueda recuperarse y examinarse por procedimientos completamente nuevos. A este procedimiento se le puede llamar la segunda ola de la revolución de la información, y en ella se empieza a vislumbrar un "nuevo sentido" a la enorme cantidad de información acumulada. • Más allá de los grandes desafíos que supone la existencia de textos, objetos, audio y video digitalizados, existen otras oportunidades igualmente interesantes para usar el acceso universal y crear fuentes de conocimiento como las bibliotecas tradicionales han hecho ampliamente durante casi 2000 años

  9. Como son las Bibliotecas Digitales • Las Bibliotecas Digitales rara vez son grandes recopilaciones situadas en un sólo lugar. • Tienden a ser recopilaciones combinadas de depósitos de información, basadas en red, que usan una gran variedad de protocolos informáticos para acceder y distribuir su contenido. • Esto es característico de las Bibliotecas Digitales de centros de investigación y universidades.

  10. Como son las Bibliotecas Digitales • En algunos casos, los Sistemas de Gestión de Documentos que se encuentran en grandes empresas, han crecido hasta convertirse en Bibliotecas Digitales, con material de video y audio así como de texto e imagen. Sin embargo, los ejemplos más singulares de Bibliotecas Digitales actualmente son recopilaciones tradicionales, como la Biblioteca del Vaticano. • La cantidad de información digital on-line se multiplica por diez cada año. Este crecimiento sobrepasa con mucho el desarrollo de tecnología necesaria para usar este material de una manera efectiva.

  11. Como son las Bibliotecas Digitales • La World Wide Web no constituye, por sí misma, una Biblioteca Digital. Es un entorno relativamente incontrolado, caótico y abierto. Puede utilizarse, sin embargo, para acceder a las Bibliotecas Digitales. • Mientras las bibliotecas tradicionales usan el sistema de catalogación de la "Library of Congress" (Biblioteca del Congreso de los Estados Unidos, la más famosa y completa del mundo) u otros procedimientos, las Bibliotecas Digitales deben ofrecer unos medios más intuitivos para encontrar y acceder a toda su gama de información multimedia.

  12. "¿Cuándo una Biblioteca Digital es una Biblioteca Digital?" • Existe un consenso inicial de que una simple recopilación de información multimedia disponible on-line no constituye necesariamente una "Biblioteca". Las bibliotecas llegan a ser bibliotecas en base al valor que los bibliotecarios inteligentes les van añadiendo. Su papel, según parece, continuará creciendo y evolucionando en tanto en cuanto la demanda y la disponibilidad de Bibliotecas Digitales crezca.

  13. "¿Cuándo una Biblioteca Digital es una Biblioteca Digital?" • En esencia, la esperanza de las Bibliotecas Digitales es la potencialidad de convertir "simple información" en "conocimiento útil". Las personas con habilidades, ayudadas por agentes inteligentes y medios intuitivos para buscar, comparar y analizar esta información, son la clave para esta esperanza. • Además, como las Bibliotecas Digitales han hecho que materiales inaccesibles hasta ahora estén disponibles a cualquiera que cuente con un ordenador, los problemas sobre la protección de información y los "licensing fees" deben ser solucionados apropiadamente.

  14. Definición de la Biblioteca Digital Phronesis • Una Biblioteca Digital es una colección de textos en soporte electrónico disponible para el usuario final. • Es el conjunto de recursos disponibles a través de Internet a los cuales se puede tener acceso por medio de la Biblioteca Digital Phronesis

  15. En varios países se han destinado fondos para encontrar soluciones viables a estos problemas y promover la investigación, el desarrollo y la aplicación de bibliotecas digitales. • Como ejemplos podemos citar la creación de Digital Library Initiative, compuesto por organizaciones gubernamentales y universidades de Estados Unidos.

  16. Gracias al apoyo del Consejo Nacional de Ciencia y Tecnología (CONACYT) y del ITESM, Campus Monterrey se inició un proyecto orientado a desarrollar e investigar la tecnología de bibliotecas digitales con la finalidad concreta de obtener una herramienta que permitiera la fácil creación de éstas así como el fácil acceso a documentos digitales almacenados en ellas y, a su vez, que sea un medio para la investigación y el desarrollo de temas relacionados con bibliotecas digitales.

  17. Phronesis en griego significa sabiduría). Phronesis es accesible vía WWW, brindando la oportunidad para que cualquier persona con acceso a Internet pueda realizar búsquedas en la biblioteca. • Las búsquedas se hacen no sólo mediante el titulo o palabras claves del documento sino también es posible realizarlas con base en el contenido del documento y sus metadatos (información acerca del documento como autor, tema, etcétera.).

  18. Una vez localizado el documento es posible tener acceso directo al mismo. Phronesis ha sido diseñada para operar de manera distribuida de tal forma que es posible contar con varias instancias de Phronesis, donde cada instancia podría almacenar documentos de una cierta tarea o de una cierta institución. • Los usuarios de Phronesis pueden realizar búsquedas de todas las instancias de Phronesis disponibles en forma transparente.

  19. Indexamiento y búsquedas en texto completo y/o en metadatos de los documentos.   • Soporte para búsquedas de documentos escritos en Ingles y Español. • Soporte de búsquedas dentro del contenido de documentos y en metadatos en formato de Texto, PostScript, HTML, PDF y RTF. • Soporte para almacenar cualquier tipo de documento y realizar búsquedas en sus metadatos (JPEG, MPEG, GIF, DOC, etcétera). • Búsquedas simultáneas en varios repositorios de la Biblioteca.

  20. El software que constituye Biblioteca Digital Phronesis es 100% de dominiopúblico • Control de acceso de los usuarios que pueden contribuir material a la biblioteca • Interfaz de usuario basada en WWW en español e inglés • Búsquedas simultáneas en varias instancias de Phronesis • Compresión eficiente de los documentos digitales.

  21. Un usuario que cuenta con una clave de acceso para envío de documentos puede depositar documentos en la biblioteca digital directamente desde su computadora. • El envío de documentos es por medio de WWW y el usuario proporciona el documento original en formato digital así como los metadatos del documento. Los metadatos se basan en el estándar internacional Dublín Core definido por OCLC (On Line Computer Library Center).

  22. Cualquier usuario con acceso a WWW puede consultar la biblioteca y puede realizar búsquedas de dos tipos principales: búsqueda booleana y búsqueda categorizada. • La búsqueda booleana utiliza palabras combinadas con operadores booleanos (y, o, no) y se obtienen todos los documentos que cumplan con dicha expresión. En la búsqueda categorizada, solamente se especifican palabras y se obtienen los documentos más relevantes de acuerdo con las palabras especificadas.

  23. La característica principal de estas búsquedas es que se pueden realizar en todo el contenido del documento y/o en sus metadatos. además, se cuenta con soporte para el idioma español, de tal manera que se pueden realizar búsquedas por palabras que contengan acentos, la letra ñ, y otros caracteres especiales de esta lengua. • Cuando existen otras instancias de Phronesis las búsquedas se realizan en paralelo y de una manera transparente en cada una de las instancias

  24. Una vez localizados los documentos se muestra información condensada de los mismos como lo es el titulo, autor y descripción, entre otros datos. • Para cada uno de los documentos encontrados el usuario cuenta con opciones para obtener directamente el documento y guardarlo en su computadora local, ver mayor información del documento o ver el texto sin formato (sin figuras ni tipos de letra). • Esta última opción es útil para que el usuario pueda explorar el contenido del documento sin necesidad de transmitir todo el documento completo hasta su computadora.

  25. Las herramientas principales con las que se puede comparar Phronesis son los motores de búsqueda. • Sin embargo, muchos de éstos, a diferencia de Phronesis, realizan sus búsquedas sólo en los metadatos, manejan un conjunto muy limitado de tipos de documentos (típicamente texto y html), no consideran el idioma español, y no cuentan con control de acceso de los usuarios que depositan documentos lo cual provoca la baja calidad de los documentos encontrados

  26. Tipos de Usuarios Phronesis • Administrador. Es quien se encarga de todo lo relacionado con la administración técnica del repositorio: asignar cuentas a usuarios, actualizar las colecciones, eliminar documentos. • Usuario registrado. Es aquél que está autorizado para consultar y/o enviar documentos para ser almacenados en la Biblioteca • Usuario de búsquedas. Es aquel que puede hacer consultas sin tener la opción de enviar documentos a la Biblioteca.

  27. INSTALACION DE PHRONESIS • Todo el software que se está utilizando y desarrollando como parte del proyecto Phronesis es de dominio público por lo cual cualquier persona puede copiar el software e instalarlo. Phronesis ha sido compilado y usado exitosamente en estos sistemas UNIX: • - Sun SPARC Ultra 5 con Solaris 2.6 • - IBM Power PC con AIX 4.1 • - Dual Pentium II con Solaris 2.7 • - Dual Pentium II con Red Hat 6.0

  28. Requerimientos del Sistema • Espacio del disco • Para compilar Phronesis se necesita 60 MB de disco libre. Cuando la instalación el proceso ha terminado se puede quitar el directorio Phronesis/mg-phron para que libere espacio del disco. • Una Colección de Phronesis vacía requiere 40 MB de espacio del disco. Una vez se ha instalado una colección, las colecciones siguientes requerirán 22 MB de espacio de disco porque los archivos del directorio bin son compartidos entre las diferentes colecciones que corren en un solo host.

  29. Cómo Instalar Phronesis • La instalación de un Servidor de Phronesis requiere 4 pasos • A) Se debe instalar y verificar que se tiene todo el software requerido así: • - gcc v2.7 o posterior - Perl 5.003 o posterior • - nawk - sed • - Servidor de WWW (apache o mosaico) • - Ghostscript/Ghostview

  30. - zip/unzip • - Libwww-perl5.41 • - MIME-Base64-2.11.tar.gz • - URI-1.00.tar.gz • - Digest-MD5-2.04.tar.gz • - HTML-Parser-2.22.tar.gz • libnet-1.0606.tar.gz, - libwww-perl-5.41.tar.gz , • - ParallelUserAgent-2.40.tar.gz

  31. B) Verificar la configuración del servidor WWW • Se necesitan modificar los archivos de configuración del servidor apache, que por lo general se encuentran en el directorio /etc/httpd/conf. Estos archivo son: • access.conf: En este archivo se debe agregar las siguientes líneas al final del mismo: • <Directory /home/httpd/html> • Options Indexes FollowSymLinks ExecCGI • <Limit GET> • order allow,deny • allow from all • </Limit> • </Directory>

  32. httpd.conf: En este archivo se debe cambiar el timeout, por ejemplo 3600 es el número de segundos que debe esperar el servidor para que un usuario suba una archivo, una hora es más que suficiente a menos que la red sea lenta y los archivos sean muy grandes, esto se debe mirar a consideración del administrador de la red. • srm.conf: En este archivo aparecerá una línea así: • DirectoryIndex index.html • Esta se debe modificar por: • DirectoryIndex index.html Default.html default.html

  33. También aparecen con comentario las siguientes líneas: • # To use CGI scripts: • # • # AddHandler cgi-script .cgi • Estas se deben modificar por: • # To use CGI scripts: • # • AddHandler cgi-script .cgi • Una vez hechos todos estos cambios se debe reiniciar el servidor de http, esto se puede hacer con el siguiente comando: • /etc/rc.d/init.d/httpd restart

  34. C) Descomprimir la distribución de Phronesis • Para instalar cada módulo perl se debe ejecutar los siguientes comandos de Linux así: • tar zxvf <modulo>.tar.gz • Con este paso se descomprime la distribución de cada módulo. • cd <modulo> • perl Makefile.PL • make • make test • make install

  35. El orden en que se instalan los módulos es importante porque algunos depende de otros, por eso la secuencia de instalación debe ser la siguiente: • Data-Dump-0.01 • MIME-Base64-2.11 • Digest-MD5-2.04 • URI-1.00 • HTML-Parser-2.22 • libnet-1.0606 • libwww-perl-5.41 • ParallelUserAgent-240

  36. Una vez instalado los módulos perl se debe hacer lo siguiente con el archivo Phronesis.tar.gz • tar zxvf Phronesis.tar.gz • cd Phronesis/mg-phron • ./configure –exec-path=<directorio con Web> • Donde <directorio con Web> es /home/httpd/html el cual es directorio que tiene por defecto permisos de Web. • make • make install

  37. Luego se debe entrar al siguiente directorio así: • cd /home/httpd/html/install • aquí se debe modificar los siguientes archivos: • check.cgi, check_en.cgi, install.cgi, instala.cgi, instalacion.cgi • La edición consiste en cambiar solamente la primera línea de estos archivos, en ellas se definen algunas variables que contienen las direcciones de comandos, se les debe poner el camino que tiene la máquina local, por ejemplo para saber el camino de perl se debe usar el comando de which de Unix así: • which perl Su salida será algo como: /usr/bin/perl • Esta línea reemplazará a cada una de las líneas de los archivos antes mencionado donde aparezca: #! /usr/localbin/perl • Después de realizado estos cambios se debe verificar que todos estos archivos tengan permiso de ejecución.

  38. D) Instalación de las Colecciones de Phronesis • Una vez se han instalado los archivos de imagen de Phronesis se está listo para instalar (vía Web) tantas Colecciones de Phronesis se requieran. • Esto se logra abriendo un browser con la siguiente dirección http://<host>/install, donde aparecerá el primer pantallazo de instalación de Phronesis; desde este punto la instalación es relativamente simple; se debe escoger el idioma como se muestra en la siguiente fígura:

  39. Luego aparecerá un formato de instalación donde se deben llenar todos los campos que se piden: • ASPECTOS GENERALES DEL SITIO Nombre de la biblioteca en español Nombre de la biblioteca en inglés Prefijo para el identificador de los documentos Idioma:

  40. DIRECTORIOS DE INSTALACIÓN Directorio donde se instalará Phronesis Dirección URL donde se instalará la página principal de Phronesis Directorio para almacenamiento de archivos auxiliares Directorio para almacenamiento de los archivos que se envíen a Phronesis: • Directorio para almacenamiento del índice de los documentos

  41. DIRECTORIOS DE APLICACIONES En esta parte del formato se deben escribir las rutas donde se encuentran las aplicaciones que hacen posible la ejecución de Phronesis. Por medio del comando which se ubican los directorios donde se encuentran estas aplicaciones, así: Para la aplicación de Ghostscript ejecutamos which gs y encontramos la siguiente ruta: /usr/bin/gs.

  42. Este procedimiento se realiza para las aplicaciones siguientes que son: perl, zip, unzip, gunzip, uncompress, csh, nawk o gawk, sed. Encontramos las siguientes rutas respectivamente: /usr/bin/perl • /usr/bin/zip • /usr/bin/unzip • /usr/bin/gunzip • /usr/bin/uncompress • /bin/csh • /usr/bin/gawk • /bin/sed

  43. DETALLES DE LA BILIOTECA Nivel de control de acceso del sitio Correo electrónico del administrador Lista de Temas Directorios de archivos imagen de Phronesis Por último, se da click en la opción de instalar y si esta ha sido correcta aparecerá un pantallazo confirmando que ha sido excelente la instalación Después de haber realizado todo esto la Biblioteca Digital Phronesis Ha sido instalada completamente, y se podrá acceder abriendo un browser , donde aparecerá la pagina principal de Phronesis.

  44. Repositorios • Un repositorio es el lugar físico donde se almacenan los documentos en forma digital. Cada biblioteca tiene asociado un repositorio primario el cual esta conformado por su propia colección de documentos y eventualmente ésta puede hacer búsquedas en repositorios secundarios, los cuales pertenecen a otras bibliotecas. Un repositorio secundario son todas aquellas colecciones a las que una biblioteca puede tener acceso pero que no le pertenecen.

  45. Funcionamiento • Para poder usar Biblioteca Digital Phronesis es necesario contar con un navegador de Internet que soporte frames, es por eso que se recomienda ampliamente las versiones 4.0 o superiores de Netscape y Explorer, sin embargo se ha detectado unos errores de JavaScript independientes de Phronesis en las versiones 3.01 y 4.05 de Netscape para Macintosh, por lo cual se recomienda utilizar el Internet Explorer.

More Related