1 / 45

Contenidos

GBIF es una iniciativa internacional que se propone hacer accesible a travs de Internet de forma gratuita toda la informacin disponible sobre los organismos vivos conocidos a nivel mundialConcebida a instancias de la OCDE (Organizacin para la Coorperacin y el Desarrollo Eeconmico)1996, MegaS

thor
Télécharger la présentation

Contenidos

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    2. Contenidos GBIF qu es trabajo y principios proveedores actuales cmo se proporcionan datos protocolos + estndares utilizados paquetes software disponibles Formatos de intercambio para especmenes y observaciones Estndar Darwin Core 2: versiones 1.2 y 1.4 Estndar ABCD DiGIR Protocolo DiGIR provider software Caso Prctico I. Instalacin de DiGIR provider UDDI Plataforma UDDI UDDI en GBIF Registro y Actualizacin Caso prctico II. Registro y Navegacin en el UDDI de GBIF Portales de GBIF Caso prctico III. Navegacin en los portales de bsqueda de GBIF TAPIR: Protocolo TapirLink software Caso prctico IV. Instalacin TapirLink, manejo y migracin desde DiGIR

    3. GBIF es una iniciativa internacional que se propone hacer accesible a travs de Internet de forma gratuita toda la informacin disponible sobre los organismos vivos conocidos a nivel mundial Concebida a instancias de la OCDE (Organizacin para la Coorperacin y el Desarrollo Eeconmico) 1996, MegaScience Forum Working Group- encargado de lanzar iniciativas cientficas de inters fundamental pero que por su escala no eran abordables por pas alguno. En este foro surge el concepto de GBIF con la idea de aplicar la informtica como mecanismo para facilitar y administrar informacin proveniente de la naturaleza Los miembros son estados, economas y organizaciones internacionales Los estados miembros se comprometen a establecer uno ms nodos a travs de los que compartir su informacin sobre biodiversidad contribuyendo adems econmicamente a la inciativa INFRAESTRUCTURA MUNDIAL DE INFORMACIN EN BIODIVERSIDAD GBIF

    4. TRABAJO Y PRINCIPIOS DE GBIF Trabaja para construir la principal red de bases de datos sobre biodiversidad, herramienta fundamental en el desarrollo cientfico de los pases y que contribuir a una mejor proteccin y uso de la biodiversidad en el planeta Principios: Los proveedores de datos tienen el control sobre los mismos, sus bases de datos tienen entidad por s mismas y se reconocen los derechos de propiedad intelectual Promueve una arquitectura no centralizada, y el uso de software de cdigo abierto Esta red se construye a partir de fuentes hetereogneas relativas a datos primarios: Especimenes, Observaciones y Nombres

    6. Proveedores de Datos Actualmente: 201 Proveedores de datos 1086 Colecciones Ms de 125 millones de registros de especimenes/observaciones.

    7. Como se proporcionan los datos a GBIF? A travs de un modelo en el que los proveedores puedan: Controlar y gestionar el acceso a los datos Proporcionar los metadatos tanto de las instituciones como de las colecciones Uso de paquetes software desarrollados recomendados por gbif.org Registro en el UDDI Fuente de datos previamente avalada por el nodo http://registry.gbif.net/uddi/web [Servicio de Alojamiento de la Unidad de Coordinacin GBIF.es]

    8. Estndares y protocolos en biodiversidad Existe una gran cantidad de informacin sobre biodiversidad a nivel mundial (Nmero esperado de especies: 10 millones. 1.7 millones han sido descritas y nombradas. Nmero total de especmenes en las colecciones del mundo de 1-3 mil millones.) Accesibilidad + Comparticin + Integracin (S.O y B.D) + Evitar la duplicacin de esfuerzos Para hacer posible el intercambio de informacin sobre biodiversidad (interoperabilidad) Formatos de intercambio de informacin (definicin de datos comunes) + Protocolos que permitan la comunicacin y el transporte de esos formatos [TDWG:Foro de debate para proyectos de datos biolgicos, desarrollando y promoviendo el uso de estndares para facilitar el intercambio de datos, y evitar la duplicidad de esfuerzos]

    9. Paquetes de Software GBIF recomienda el uso de diversos paquetes de software (provider package) compuestos por: -Un formato de intercambio de datos comn (estndar) -Un protocolo que sea capaz de reconocer y manejar dicho formato a travs de internet ?DiGIR protocol (http://www.digir.net/) + Darwin Core (http://darwincore.calacademy.org/) ?BioCASE protocol (http://www.biocase.org/) + ABCD (http://www.bgbm.org/TDWG/CODATA/default.htm) ?[TAPIR protocol (http://www.tdwg.org/activities/tapir/)]

    10. Versiones soportadas Las combinaciones de protocolos + formatos de intercambio

    11. Paquetes de Software DiGIR Provider (php) Desarrollado a partir del data provider de digir.sourceforge.net y modificado para que sea capaz de trabajar con el registro UDDI Soportado por el Secretariado Internacional de GBIF (workshops, helpdesk) GBIF Data Repository Tool Herramienta para Nodos que permite crear y gestionar un servicio de alojamiento (almacena datos subidos en formato documento, como hojas excel,documentos de Word, etc) DiGIR,Python, Zope y MySQL Soportado por el Secretariado Internacional de GBIF Disponibles desde: GBIF tools downloads: (http://www.gbif.org/serv/gbif-tools) BioCASE - BioCASE wrapper 2.0 (http://www.biocase.org/provider/) TAPIR - PyWrapper v3 (http://trac.pywrapper.org/pywrapper/) TAPIR-TapirLink http://wiki.tdwg.org/twiki/bin/view/TAPIR/TapirLink

    12. Darwin Core 2 (DwC) Estndar diseado para facilitar el intercambio de informacin de datos primarios de biodiversidad a travs de internet Caractersticas: Para datos de colecciones y datos observacionales Representa un mnimo comn denominador en la la informacin a compartir. Informacin en espacio y tiempo: El qu, el cuando y el dnde. (+extensiones 1.4) Simplicidad: minimizando las barreras entre los proveedores de datos maximizando la disponibilidad para los usuarios Para intercambio, no para modelado de datos Historia: Inicios: 2001-2003. The Species Analyst - Universidad de Kansas. En 2002 MaNIS - de la Universidad de Berkeley. 1 red distribuida basada en DiGIR + Darwin Core (MANIS version) Desde 2004. TDWG. ltima versin -Draft (adaptacin nueva arquitectura TDWG). Task Group:Darwin Core (DwC)

    13. Darwin Core 2 (DwC) Estadsticas de uso a nivel mundial (fuente: http://bigdig.ecoforge.net/ para DiGIR) Nmero de proveedores:210 Nmero de fuentes (resources):1225 Nmero de registros:100.472.356 Versiones: [El documento que define el estndar es un XML Schema (*.xsd) ] DwC 1.2 schema Primera versin (usada en GBIF) DwC 1.21 schema revisin (usada en GBIF, MaNIS, HerpNet, OrNIS, y FishNet2) DwC 1.3 schema Presentado en el TDWG Meeting 2004 (no utilizada) DwC 1.4 schema Borrador bajo discusin (no para uso) OBIS Basada en DwC 1.2 (usada en GBIF, Ocean Biogeographic Information System)

    14. Darwin Core 1.2

    15. Darwin Core 1.2 Documento traducido al espaol: http://www.gbif.es/ficheros/DarwinCore2_esp.pdf

    16. Campos de Darwin Core 1.2 DateLastModified: La fecha y hora de la ultima modificacin del registro segn norma ISO 8601 en UTC(GMT). Ejemplo: "5 de Noviembre 5, 1994, 8:15:30, Madrid (GMT+1:00)" sera "1994-11-05T7:15:30Z" InstitutionCode: Un cdigo que identifica la institucin o centro a la que la coleccin pertenece. No existe ningn registro global para la asignacin de los cdigos; utiliza el cdigo que es estndar dentro de tu disciplina. CollectionCode: Un valor alfanumrico nico que identifica la coleccin dentro de la institucin. CatalogNumber: Un texto alfanumrico nico que identifica un registro individual dentro de una coleccin. Se recomienda que este valor proporcione una clave por la que el espcimen en cuestin puede ser identificado. Si el espcimen tiene varios elementos como por ejemplo varios tipos de preparacin, este valor debera identificar la componente individual del espcimen. ScientificName: nombre completo de menor rango especificado en la identificacin del organismo. BasisOfRecord: Una descripcin que indica si el registro representa una observacin (O), un organismo vivo (L), un espcimen testigo (S), germoplasma/semilla (G) etc. Kingdom: El nombre del reino al que pertenece el organismo. Phylum: El nombre de la divisin al que pertenece el organismo. Class: El nombre de la clase al que pertenece el organismo. Order: El nombre del orden al que pertenece el organismo. Family: El nombre de la familia al que pertenece el organismo. Genus: El nombre del gnero al que pertenece el organismo. Species: El nombre de la especie al que pertenece el organismo. Subspecies: El nombre de la subespecie al que pertenece el organismo. ScientificNameAuthor: El autor o autores del nombre cientfico. Se debe ajustar a las convenciones de la disciplina taxonmica correspondiente.

    17. Campos de Darwin Core 1.2 IdentifiedBy: El/los nombre/s de la/s persona/s que asignaron el nombre cientfico, actualmente aceptado, al objeto catalogado. YearIdentified: El ao de la identificacin, con cuatro dgitos, p. ejemplo 1906, 2002 etc. MonthIdentified: El mes de la identificacin, con dos dgitos [01..12]. DayIdentified: El da del mes de la identificacin, con dos dgitos [01..31]. TypeStatus: Indica la designacin ms reciente del ejemplar como tipo nomenclatural. CollectorNumber: Un nmero identificador (en formato texto) aplicado al ejemplar en el momento de la recoleccin. Establece enlaces entre diferentes partes/preparaciones de un nico espcimen y entre notas de campo y el espcimen. FieldNumber: Un nmero identificador (en formato texto) aplicado en el momento de la recoleccin a un conjunto de material que se ha generado durante una nica recoleccin. Collector: El/los nombre/s del/los recolector/es responsable/s de la recoleccin o que hizo la observacin. YearCollected: El ao durante el que el ejemplar ha sido recolectado en el campo, siempre con cuatro dgitos, p.ej. 1972. MonthCollected: El mes del calendario durante el que el ejemplar ha sido recolectado en el campo, siempre con dos dgitos, [0112]. DayCollected: El da del mes durante el que el ejemplar ha sido recolectado en el campo, siempre con dos dgitos, [0131]. JulianDay: El da ordinario del ao (o sea, el nmero de das pasados desde el da 31 de Diciembre del ao anterior, el 1 de Enero es JulianDay 1) en que el ejemplar ha sido recolectado. Puede ser calculado mediante los campos YearCollected, MonthCollected, y DayCollected.

    18. Campos de Darwin Core 1.2 TimeOfDay: La hora en que el ejemplar ha sido recolectado, expresado como hora decimal desde medianoche, hora local (p.ej.: 12.0 y 13.5). ContinentOcean: El nombre completo del continente u ocano donde el ejemplar ha sido recolectado. Country: El pas o la unidad poltica mayor donde el espcimen ha sido recolectado, expresado segn la norma ISO 3166-1 con cdigo de dos letras, p.ej. Espaa = ES. StateProvince: El nombre completo de la provincia del que el ejemplar ha sido recolectado. County: El nombre completo del municipio del que el ejemplar ha sido recolectado. Locality: Descripcin de la localidad de recoleccin. Longitude: La longitud de la localizacin donde el ejemplar ha sido coleccionado, expresado en grados decimales. Latitude: La latitud de la localizacin donde el ejemplar ha sido coleccionado, expresado en grados decimales. CoordinatePrecision: Una estima de cmo de cerca ha sido especificada la localidad de recoleccin; expresada en la distancia en metros que corresponde al radio alrededor de la localidad. Utiliza NULL si el error es desconocido, si no se puede estimar o si no aplica. BoundingBox: Proporciona un mecanismo para ejecutar bsquedas utilizando un cerco. Un cerco normalmente no est presente en la base de datos, pero se puede generar a partir de los campos Latitude y Longitude. (este dato NO es devuelta en las bsquedas) MinimumElevation: La distancia mnima en metros por encima (positivo) o por debajo (negativo) del nivel del mar en que se encuentra la localidad de recoleccin. MaximumElevation: La distancia mxima en metros por encima (positivo) o por debajo (negativo) del nivel del mar en que se encuentra la localidad de recoleccin.

    19. Campos de Darwin Core 1.2 MinimumDepth: La distancia mnima en metros por debajo de la superficie del agua donde la recoleccin ha sido realizada; todo el material recolectado tiene al menos esta profundidad. Positivo por debajo de la superficie, negativo por encima (p. ejemplo: recolecciones por encima del nivel del mar en zonas de marea). MaximumDepth: La distancia mxima en metros por debajo de la superficie del agua donde la recoleccin ha sido realizada; todo el material recolectado tiene al menos esta profundidad. Positivo por debajo de la superficie, negativo por encima (p.ejemplo: recolecciones por encima del nivel del mar en zonas de marea). Sex: Cdigo que representa el sexo del organismo (propuesto: M=macho, F=hembra, H=hermafrodita, I=sin determinar (examinado pero no pudo ser determinado), U=desconocido (no examinado), T=transicional (entre sexos, til para hermafroditas secunciales) PreparationType: Una lista de mtodos de preparacin y conservacin del ejemplar (piel, crneo, esqueleto, animal entero (ETHO), preparacin microscpica, etc.). Se refiere a un nico registro de coleccin. IndividualCount: El nmero de individuos presentes en un lote o contenedor a que el nmero de catalogo se refiere. No es una estima de la abundancia o densidad en la localidad de recoleccin. PreviousCatalogNumber: Lista de cdigos de coleccin asignados previamente al ejemplar. Tiene que ser compuesto por el cdigo del centro y del cdigo de la coleccin, aunque quizs ya no existan. RelationshipType: Un nombre o cdigo que identifica el tipo de relacin entre el registro de la coleccin y el registro de la coleccin referenciada. Valores que puede tener: "parasite of", "epiphyte on", "progeny of", etc. En futuras versiones del esquema este atributo podra ser interesante. RelatedCatalogItem: El identificador completo del registro con el cual est relacionado (una referncia a otro espcimen); Compuesto por: Institution Code, Collection Code y Catalogue Number del registro con el que se relaciona (los tres elementos separados por un espacio). Notes: Cualquier anotacin que se desee realizar sobre el registro (espcimen u observacin).

    20. Darwin Core 1.4 Estado:Draft. Se encuentra bajo desarrollo para adaptarse a la nueva arquitectura del TDWG Formado por un ncleo central de elementos y una serie de extensiones con informacin adicional: de una disciplina en concreto simplemente informacin extra Independiente del protocolo DiGIR Incluye GlobalUniqueIdentifier XML Schema: Core: http://rs.tdwg.org/dwc/tdwg_dw_core.xsd Extensin curatorial: http://rs.tdwg.org/dwc/tdwg_dw_curatorial.xsd Extensin geoespacial: http://rs.tdwg.org/dwc/tdwg_dw_geospatial.xsd Extensin Paleontolgica

    21. Darwin Core 1.4 Core: Elementos a nivel de registro: GlobalUniqueIdentifier , DateLastModified , BasisOfRecord , InstitutionCode , CollectionCode , CatalogNumber , InformationWithheld , Remarks Elementos taxonmicos: ScientificName, HigherTaxon , Kingdom , Phylum, Class, Order , Family, Genus, SpecificEpithet, InfraspecificRank, InfraSpecificEpithet, AuthorYearOfScientificName , NomenclaturalCode Elementos de Identificacin : IdentificationQualifer Elementos referentes a la localidad y localizacin: HigherGeography, Continent, WaterBody, IslandGroup, Island, Country, StateProvince, County, Locality, MinimumElevationInMeters, MaximumElevationInMeters, MinimumDepthInMeters, MaximumDepthInMeters Elementos referentes al evento de recoleccin : CollectingMethod, ValidDistributionFlag, EarliestDateCollected, LatestDateCollected, DayOfYear, Collector Elementos biolgicos: Sex, LifeStage, Attributes Elementos de referencia: ImageURL, RelatedInformation

    22. Darwin Core 1.4 Extension Curacional: Elementos a nivel de registro: CatalogNumberNumeric , IdentifiedBy, DateIdentified, CollectorNumber, FieldNumber, FieldNotes, VerbatimCollectingDate, VerbatimElevation, VerbatimDepth, Preparations, TypeStatus, GenBankNumber, OtherCatalogNumbers, RelatedCatalogedItems, Disposition, IndividualCount Extensin Geoespacial: Elementos Geoespaciales: DecimalLatitude, DecimalLongitude, GeodeticDatum, CoordinateUncertaintyInMeters, PointRadiusSpatialFit, VerbatimCoordinates, VerbatimLatitude, VerbatimLongitude, VerbatimCoordinateSystem, GeoreferenceProtocol, GeoreferenceSources, GeoreferenceVerificationStatus, GeoreferenceRemarks, FootprintWKT, FootprintSpatialFit Extensin Paleontolgica: Elementos Paleontolgicos: EarliestEonOrLowestEonothem, LatestEonOrHighestEonothem, EarliestEraOrLowestErathem, LatestEraOrHighestErathem, EarliestPeriodOrLowestSystem, LatestPeriodOrHighestSystem, EarliestEpochOrLowestSeries, LatestEpochOrHighestSeries, EarliestAgeOrLowestStage, LatestAgeOrHighestStage, LowestBiostratigraphicZone, HighestBiostratigraphicZone, LithostratigraphicTerms, Group, Formation, Member, Bed

    23. ABCD (Access to Biological Collections Data ) ABCD Access to Biological Collections Data (2.0.6a) Para datos de colecciones biolgicas (especmenes y observaciones) Proporciona definiciones semnticas Estructura jerrquica (alta estructuracin con gran nmero de elementos. Pretende cubrir un mximo de detalle) Trabaja con extensiones Posibilidad de trabajo con diferentes niveles de detalle (atomizacin/fusin) Incluye GUIDs Indica en que idioma est la informacin contenida Permite la repeticin de registros (por ejemplo revisiones) Compatibilidad con Darwin Core (versiones 1.2 y 1.4), HISPID (Herbarium Information Standards and Protocols for Interchange of Data ), etc. http://www.bgbm.org/tdwg/codata/schema/

    24. Compatibilidad DwC-ABCD Darwin Core (DwC) y ABCD son estndares complementarios Dwc es una estructura plana representa el mnimo comn denominador ABCD. Para mximo detalle de los registros; est estructurado de forma jerrquica y soporta la repeticin de elementos Para asegurar la interoperabilidad la traduccin entre ambos estndares debe de estar asegurada. Los elementos de DwC han sido mapeados a ABCD URL del mapeo: http://www.bgbm.org/TDWG/CODATA/Schema/Mappings/DwCAndExtensions.htm

    25. DiGIR: Distributed Generic Information Retrieval Es un protocolo cliente/Servidor para recopilar datos desde fuentes distribuidas. Usa HTTP como protocolo de transporte y XML para la codificacin de los mensajes entre cliente y servidor. Tres tipos de mensajes: Metadata: Obtiene los metadatos de los proveedores y de las fuentes de datos servidas. Search: Encuentra registros de especimenes y observaciones que cumplen un criterio de bsqueda, por ejemplo: el nombre de una especie y/o un rectngulo que define un rea de la superficie de la tierra y/o Inventory: Obtiene el conjunto de valores asociados a un concepto. Por ejemplo: Especies. Proporciona un nico punto de acceso a varias fuentes distribuidas de informacin Trabaja con el estndar de intercambio Darwin Core2 (para especimenes y observaciones), estableciendo la correspondencia entre las bases de datos de las colecciones y este formato.

    26. DiGIR Provider: Como Trabaja?

    27. DiGIR Provider: Dnde se integra?

    28. DiGIR y Darwin Core2 Request: <?xml version="1.0" encoding="UTF-8"?> <request xmlns="http://digir.net/schema/protocol/2003/1.0" xmlns:darwin="http://digir.net/schema/conceptual/darwin/2003/1.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://digir.net/schema/protocol/2003/1.0 http://digir.sourceforge.net/schema/protocol/2003/1.0/digir.xsd http://digir.net/schema/conceptual/darwin/2003/1.0 http://digir.sourceforge.net/schema/conceptual/darwin/2003/1.0/darwin2.xsd"> <header> <version>0.95</version> <sendTime>2005-06-14T18:30:19+02:00</sendTime> <source>127.0.0.1</source> <destination resource=biotella">http://giorgos.gbif.org:80/digir/DiGIR.php</destination> <type>search</type> </header> <search> <filter> <like> <darwin:InstitutionCode>bioshare.com</darwin:InstitutionCode> </like> </filter> <records limit=3" start="0"> <structure schemaLocation="http://digir.sourceforge.net/schema/conceptual/darwin/brief/2003/1.0/darwin2brief.xsd"/> </records> <count>true</count> </search> </request>

    29. DiGIR y Darwin Core2 Response <?xml version="1.0" encoding="utf-8" ?> <responseWrapper> <response xmlns='http://digir.net/schema/protocol/2003/1.0'> <header> <version>$Revision: 1.10 $</version> <sendTime>11-09-2003 16:33:53+0200</sendTime> <source resource="biotella">http://giorgos.gbif.org:80/digir/DiGIR.php</source> <destination>192.38.103.181</destination> </header> <content xmlns:darwin='http://digir.net/schema/conceptual/darwin/2003/1.0' xmlns:xsd='http://www.w3.org/2001/XMLSchema' xmlns:xsi='http://www.w3.org/2001/XMLSchema-instance'> <record> <darwin:DateLastModified>19930717T225000Z</darwin:DateLastModified> <darwin:InstitutionCode>bioshare.com</darwin:InstitutionCode> <darwin:CollectionCode>pyy</darwin:CollectionCode> <darwin:CatalogNumber>4</darwin:CatalogNumber> <darwin:ScientificName>Diarsia mendica</darwin:ScientificName> </record> <record> <darwin:DateLastModified>19950526T220000Z</darwin:DateLastModified> <darwin:InstitutionCode>bioshare.com</darwin:InstitutionCode> <darwin:CollectionCode>pyy</darwin:CollectionCode> <darwin:CatalogNumber>6</darwin:CatalogNumber> <darwin:ScientificName>Lycia lapponaria</darwin:ScientificName> </record> <record> <darwin:DateLastModified>19950526T220000Z</darwin:DateLastModified> <darwin:InstitutionCode>bioshare.com</darwin:InstitutionCode> <darwin:CollectionCode>pyy</darwin:CollectionCode> <darwin:CatalogNumber>7</darwin:CatalogNumber> <darwin:ScientificName>Plutella maculipennis</darwin:ScientificName> </record> </content> <diagnostics> <diagnostic code="MATCH_COUNT" severity="info">42763</diagnostic> <diagnostic code="RECORD_COUNT" severity="info">3</diagnostic> <diagnostic code="END_OF_RECORDS" severity="info">false</diagnostic> </diagnostics> </response> </responseWrapper>

    30. Paquete GBIF DiGIR Provider Incluye: El software del DiGIR Provider. Servidor Web Apache2 Y libreras de PHP. Solo se necesita tener conocimientos bsicos del sistema operativo. Disponibles para: (http://circa.gbif.net/Public/irc/gbif/ict/library?l=/digir_provider_package) Linux (RedHat 7.3, 8, 9) MS Windows (2000, XP) Permite registrar nuestro proveedor de datos de forma automtica en el Servidor UDDI de GBIF (GBIF UDDI Registry: http://registry.gbif.net)

    31. Paquete GBIF DiGIR Provider Bases de datos soportadas: MySQL, PostgreSQL MS SQL Server, MS Access (solo en el pquete de DiGIR para MS Windows) Oracle 8i/9i Conexin a los datos Hay dos alternativas a la hora de conectar el software a la tabla/s con los datos a mostrar: Mapeando en la Base de Datos (rpidas consultas con ndices, disponible en Biotella). Mediante una vista, consulta, Mapeando directamente desde DiGIR Provider (no es necesario del trabajo de la base de datos)

    32. Paquete GBIF DiGIR Provider Herramientas de test: Metadata: http://nombreservidor:puerto/digir/test/eg_metadata.php Inventory: http://nombreservidor:puerto/digir/test/eg_inventory.php Search: http://nombreservidor:puerto/digir/test/eg_search.php Caso prctico I.Instalacin DiGIR provider (I.DiGIR_Provider.pdf)

    33. Monitorizacin DiGIR providers- The Big Dig The "Big Dig" es un proyecto de ecoforge.net desarrollado en 2006 por el Natural History Museum and Biodiversity Research Center of the University of Kansas Servicio que genera de manera automtica informes del estado y las caractersticas de los DiGIR providers Status:Una vez al da Schema: Una vez a la semana Evalua el estado de las instalaciones de los DiGIR provider Examina registros y reporta las caractersticas del software instalado Status, versin, nmero de colecciones, nmero de registros, schema, tiempo de respuesta, encoding Ayuda a los administradores ante posibles problemas http://bigdig.ecoforge.net/

    34. UDDI (Universal Description Discovery & Integration ) Registro pblico diseado para almacenar de forma estructurada informacin sobre empresas y los servicios web que stas ofrecen Es accedido por mensajes SOAP y da paso a documentos WSDL Tiene mtodos para publicar y encontrar informacin de negocios y especificaciones de sus servicios. Los 4 principales tipos de datos: businessEntity: representa la informacin bsica del negocio. Por ejemplo, informacin de contacto, clasificacin, descripciones, etc. businessService: describe un servicio proporcionado por el negocio. bindingTemplate: contiene la URL de su punto de acceso y una referencia a uno o ms tModel tModel: descripcin abstracta de una especificacin o comportamiento particular el cual forma el Servicio Web.

    35. UDDI de GBIF Registro automtico: herramienta de registro on-line [recomendado]. http://www.gbif.org/DataProviders/registerme El proveedor ser registrado y el GBIF Helpdesk (helpdesk@gbif.org) informar al gestor del Nodo del dominio seleccionado Registro automtico en el GBIF UDDI registry.

    36. Registro y Actualizacib en el UDDI de GBIF

    37. Portales de Bsqueda

    38. TAPIR (TDWG Access Protocol for Information Retrieval ) TAPIR es un protocolo para acceso a datos estructurados provenientes de bases de datos distribuidas de estructura lgica y fsica diferentes TAPIR combina las caractersticas de los protocolos BioCASe y DiGIR y ampla las posibilidades de comunicacin entre aplicaciones cliente y proveedores de datos a travs de Internet Su potencialidad permite la interoperabilidad no solo entre especimenes u observaciones si no que se puede utilizar en otros dominios (geolgico, ecolgico, clima, secuenciacin gentica, geoespacial, etc.) Implementaciones: wrapper applications : PyWrapper (v3) primera implementacin del TAPIR provider TapirLink (0.3.1) La primera red en implementar TAPIR: Plant Genetic Resources Community CGIAR (Grupo Consultivo para la Investigacin Agrcola Internacional ) Generation Challenge Programme Autores: Markus Dring, Renato De Giovanni

    39. TAPIR (TDWG Access Protocol for Information Retrieval ) Caractersticas: Trabaja con GUIDs TAPIR Request/Response requests pueden ser hechas en: documentos XML Key-Value Pairs (KVP) responses siempre codificadas en XML Operaciones posibles: ping metadata capabilities (servicios) inventory search No trabaja con un esquema en concreto Especificaciones y autores: http://www.tdwg.org/dav/subgroups/tapir/1.0/docs/TAPIRSpecification_2007-02-24.html Esquema: http://rs.tdwg.org/tapir/1.0/schema/tapir.xsd

    40. TAPIR transporte Transporte: http get/post Puntos de acceso: urls pueden ser descubiertos por UDDI Request (encoding): KVP (get/post method) (Obligatorio para todas las implementaciones) XML (opcional) HTTP POST body HTTP POST/GET 'request' parameter Responses: En XML HTTP Content-Type= "text/xml Compuesto por header section + resultado (estructurado segn el output model) + seccin de diagnstico (opcional)

    41. TAPIR Conceptual Binding Conceptual Schemas (capa de abstracin de datos) Formatos: XML Schema, RDF Schema, etc DarwinCore, ABCD, Concepts (definidos externamente) Concept Name Servers Output Models Para operaciones de bsqueda Definen qu tipo de contenido + estructura Documentos que definen respuestas posibles de nuestro provider En XML, basadas en XML Schema Los nodos del esquema han de estar mapeados con conceptos de uno ms conceptual schemas Dos tipos de configuracin (capabilities) Knownoutputmodels (los creados reconocidos por nosotros) Anyoutputmodels necesarios <mappedConcepts> CNS Query Templates A la definicin de contenido +estructura aade filtros parametrizables predefinidos para search e inventory CNS

    42. TAPIR Search request: Ejemplo de request en una operacin tipo serarch con XML el outputModel en este caso est definido in-line

    43. TAPIR Search response:

    44. TapirLink TapirLink es un software de implementacin del protocolo TAPIR desarrollado en PHP Una instalacin de TapirLink ?> n fuentes de datos Cada fuente de datos ?1 punto de acceso (interacciones) Cada fuente de datos puede ser mapeada con uno ms esquemas conceptuales basados en el patrn de la nueva versin (1.4) de DwC Home: http://wiki.tdwg.org/twiki/bin/view/TAPIR/TapirLink Download: http://sourceforge.net/project/showfiles.php?group_id=38190&package_id=217873 Developers: RenatoDeGiovanni, DaveVieglais, CraigWieczorek, KevinRichards

    45. TapirLink Caractersticas: Soporta todas las operaciones del protocolo: metadata, capabilities, inventory, search y ping request encodings: KVP and XML Inventory: conceptos mapeados Search: output models conceptos mapeados Response structures: basicSchemaLanguage Logs request Filtros "Equals" and "like" pueden ser sensitivos a may/min Interface web para configuracin. Incluye: Importacin de configuracin de DiGIR Registro automtico enel UDDI Cliente (test) LSID authority resolver Limitaciones: Sirve instancias de la misma clase, no de diferentes (n especmenes a su vez con mltiples identificaciones, imgenes) Caso prctico IV. Instalacin TapirLink, manejo y migracin desde DiGIR (IV.TapirLink.pdf)

More Related