1 / 26

iAHx -VHL Integrated Search

iAHx -VHL Integrated Search. iAHx - Recuperación Integrada en la BVS. Nueva herramienta de búsqueda. New search engine. II Developers meeting from BVS, SciELO and ScienTI II Encuentro de desarrolladores de la Red BVS, SciELO y ScienTI Vinicius de Andrade. Topics Topicos.

Télécharger la présentation

iAHx -VHL Integrated Search

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. iAHx -VHL Integrated Search iAHx - Recuperación Integrada en la BVS Nueva herramienta de búsqueda New search engine II Developers meeting from BVS, SciELO and ScienTI II Encuentro de desarrolladores de la Red BVS, SciELO y ScienTI Vinicius de Andrade

  2. TopicsTopicos • Current search options on VHL siteOpciones de búsqueda en el sitio BVS • New search engineNuevo sistema de búsqueda • System architectureArquitectura del sistema • Metadata indexingIndización de los metadatos • Webservice outputsSalidas del servicio web • Implementation on VHL siteImplementación en el sitio de la BVS

  3. Current StateEstado Actual • Meta-engine performs search on distributed information sourcesMetabuscador realiza consulta en fuentes de información distribuidas • User must select an information source = several steps to access informationEl usuario precisa seleccionar una fuente de información = excesivos pasos para acceso a la información • Each information source has its own presentation format and search interfaceCada fuente de información tiene su formato de presentación y interfaz de consulta • Slow learning curveCurva de aprendizaje lento • High cost of maintenance (products)Alto costo de mantenimiento (productos) • Lack of personalized servicesFalta de servicios personalizados

  4. Current StateEstado Actual

  5. New Integrated Search iAHxNueva Recuperación Integrada iAHx • Single interface to search for and present the metadata of the information sourcesInterfaz única para buscar y presentar los metadatos de las fuentes • Organization of clusters that allows the exploration and refining the set of documents retrievedOrganización de “clusters” que permiten exploración y refinamiento del conjunto de documentos recuperados • Common services: selection of documents, sent by mail, search history, etc.Servicios comunes: selección de documentos, envio por mail, historico de búsquedas, etc • Organization of the results by relevance, date and others (eg: SJR Scimago Journal Rank)Organización del resultado por relevancia, fecha y otros (ej: SJR Scimago Journal Rank) • Exports results in XML and RSS formatsExportación del resultado en XML y RSS

  6. System ArchitectureArquitectura del Sistema Index índice Index índice Interface Interfaz Controller Controlador Users Usuarios Index índice

  7. VHL – Tecnological Architecture BVS – Arquitectura Tecnológica InterfaceLevel Capa de la interfaz Index Level Capa de los índices ISISCollexisGoogle Data Level Capa de los datos Services Interfaces - WS, OAI, RSS Protocols

  8. Data Level Capa de los datos MetadataMetadatos • Conversion of information sources for a set of metadata (single schema)Conversíon de las fuentes de información para un conjunto de metadatos (schema único) • Identification of elements for organization into "clusters“Identificación de elementos para organización en “clusters”

  9. Index Level Capa de los índices IndexesÍndices Boolean query Búsqueda booleana Boolean query, page ranking Búsqueda booleana, pagerank Vectorial search with concept identification based on thesaurus Búsqueda vetorial y identificación de conceptos basedo en tesauro Boolean query, ranking and clusters Búsqueda booleana, ranking y clusters

  10. Interface Level • WS developed in Java • WS desarrollado en Java • Search interface developed in PHP • Interfaz de búsqueda desarrollado en PHP

  11. ArchitectureArquitectura

  12. Faceted Browsing Navegación por facetas "Interaction style where users filter a set of items by progressively selecting from only valid values of a faceted classification system" Keith Instone, SOASIS&T, July 8, 2004 “Estilo de interacción donde los usuarios filtran un conjunto de itens de forma progressiva seleccionando sólo valores válidos de um sistema de classificación en faceta” Traducción libre

  13. Clusters / Grupos language:en subject:asthma = 594 year:2008 intersection Size() subject:thorax = 382 asthma year asc Search(Query,Filter[],Sort,offset,n) type:article = 247 type:thesis section of ordered results = 689 Unordered set of all results journal:Rev. A = 104 DocList DocSet journal:Rev B = 92 Journal: Rev C = 75 Query Response

  14. XML indexing XML de indización <doc boost="30.0670"> <field name="id">lil-7320</field> <field name="db">LILACS</field> <field name="cc">BR1.1</field> <field name="bvs">regional</field> <field name="type">article</field> <field name="au">Ribeiro, M. V</field> <field name="au">Gallina, R. A</field> <field name="au">Sato, T</field> <field name="ti">Hidranencefalia: estudo clinicopatologico de 6 casos.</field> <field name="ti">Hydranencephaly: clinicopathological study of 6 cases</field> <field name="pg">184-92</field> <field name="fo">Arq Neuropsiquiatr;40(2)1982. </field> <field name="ta">Arq Neuropsiquiatr</field> <field name="is">0004-282X</field> <field name="vi">40</field> <field name="ip">2</field> <field name="la">pt</field> <field name="dp">1982</field> <field name="cp">BR</field> <field name="da">19820000</field> <field name="order_sjr">00.0671982</field> <field name="ab_pt">Foram estudados 6 casos de hidranencefalia do ponto de vista de sua semiologia clinica, de seus exames complementares e das verificacoes anatomopatologicas. Os autores concluem que a transiluminacao e de grande utilidade no diagnostico precoce destes casos. O seguimento dos pacientes e as verificacoes anatomopatologicas demonstram que a hidranencefalia teve como origem lesoes encefaloclasticas (inflamatorias, mecanicas e vasculares) que levaram, antes ou apos o nascimento, a destruicao total do cerebro com preservacao das estruturas sub-tentoriais</field> <field name="mj">^d6984</field> <field name="services">SCAD</field> </doc> relevancy / relevancia cluster / grupo order / ordenamiento

  15. XML outputRespuesta en XML <response> <lst name="responseHeader"> <int name="status">0</int> <int name="QTime">10</int> <lst name="params"> <str name="indent">on</str> <str name="q">iahx</str> </lst> </lst> <result name="response" numFound="2" start="0"> <doc> <str name="id">BVS-3700</str> <str name=“au">Antonio, Vinicius de Andrade</str> <date name=“ti">iAHx – integrated search</date> <str name="type">presentation</str> </doc> </result> </response>

  16. JSON outputRespuesta en JSON { "responseHeader":{ "status":0, "QTime":1, "params":{ "wt":"json", "rows":["1", "1"], "start":"0", "indent":"on", "q":“iahx", "version":"2.2"}}, "response":{"numFound":2,"start":0,"docs":[ { "id":"BVS-3700", “au":"Antonio, Vinicius de Andrade", “ti":" iAHx – integrated search ", "type":"presentation"}] }}

  17. Regional VHL site (beta)Sitio Regional de la BVS (beta)

  18. Thank You Gracias Vinicius de Andrade BIREME/OPS/OMS

More Related