410 likes | 532 Vues
国家科学数字图书馆 “ CrossSearch 跨库集成检索系统” 报告. 主要内容. 什么是跨库集成检索系统 跨库集成检索产生的背景和意义 国外的一些相关研究情况 国家科学数字图书馆 “ CrossSearch 跨库集成检索系统 ” 项目的建设情况 CrossSearch 的主体框架 CrossSearch 的特点. 1什么是跨库集成检索系统. 跨库集成检索是国内外都很关注的研究课题,有着不同的称谓: Broadcast search( 广播检索) Parallel search( 并发检索) Cross-database search( 跨库检索)
E N D
主要内容 • 什么是跨库集成检索系统 • 跨库集成检索产生的背景和意义 • 国外的一些相关研究情况 • 国家科学数字图书馆“CrossSearch跨库集成检索系统”项目的建设情况 • CrossSearch的主体框架 • CrossSearch的特点
1什么是跨库集成检索系统 • 跨库集成检索是国内外都很关注的研究课题,有着不同的称谓: • Broadcast search(广播检索) • Parallel search(并发检索) • Cross-database search(跨库检索) • Metasearch(元检索) • Federated search(联邦检索)
1什么是跨库集成检索系统 • 定义 • One simultaneous search/access to multiple databases or information sources irrespective of search engine protocol, platform, product or vendor. (by Lillian Woon Gassie, Senior Systems Librarian, Naval Postgraduate School Monterey, Ca) • 用户只需“一次就能同时对多个数据库或信息源进行检索,而不必考虑这些检索引擎的协议、平台、产品或生产商”
1什么是跨库集成检索系统 • 我们认为: • 跨库集成检索系统是以多个分布式异构数据源为对象的检索系统。它通过统一的检索界面,可以一次并发地对多个网络数据库同时进行检索,并将各个网络数据库的检索结果归并,一次提交给用户,在实体资源分散的情况下实现了“虚拟的资源整合”。
2跨库集成检索产生的背景和意义 • 跨库集成检索产生与网络化数字化环境的渐渐成熟密切相关。 • 图书馆资源的不断增加,形式多样化,在迅速查询、及时取得信息等服务的同时,也给用户和图书馆员都带来了一些问题: • Springer-Link • Ei Compendex • Web工程索引 • CSA 剑桥科学文摘数据 • 中国期刊全文数据库 • 中国科学文献数据库 • 学位论文数据库 • 全国期刊联合目录数据库 • …… • ASTP • PQDD-B 数据库(UMI博士硕士论文) • Elsevier • Science Online • Catchword • IOP • SCI科学引文索引 • ……
2跨库集成检索产生的背景和意义 • 从用户的角度来 • 尽管目前有许网络数据库可以使用,但使用者往往不知自己所要查找的信息在哪一个数据库中: • 每一个数据库的供货商或出版商不同; • 有着不同的检索界面; • 不同的使用方式; • 不同的身分认证; • 不同的呈现的格式; • 使用者无法一次获取各数据库的信息; • 导致:频繁登录和退出
2跨库集成检索产生的背景和意义 • 从图书馆的角度来看,更多的资源意味着: • 更多的培训服务; • 更多的咨询服务; • 难以利用和共享; • 更多的用户压力……
2跨库集成检索产生的背景和意义 • 跨库集成检索应运而生:它向用户提供统一的检索接口,将用户的检索要求转化为不同数据源的检索表达式,并发地检索本地的和广域网上的多个分布式异构数据源,并对检索结果加以整合,在经过去重和排序等操作后,以统一的格式将结果呈现给用户。
2跨库集成检索产生的背景和意义 • 跨库检索的这种基本原理,决定了它有以下优点: • 统一的检索入口。能够减轻用户学习检索不同数据源的负担,频繁登录和退出; • 并发检索。能节省用户总的检索时间; • 结果整合。呈现给用户的最终看结果不仅格式统一,而且按统一标准排序,大大方便了用户的浏览和选择。
3国外的一些相关研究情况 • 国外的集成检索系统的研究项目 • FlashPoint。美国新墨西哥州洛斯阿拉莫斯国家实验室研究图书馆(Los Alamos National Laboratory Research Library,LANL RL) • SearchLight。California Digital Library (CDL) • NLM Gateway。美国国立医学图书馆(NLM) • SiteSearch。OCLC • Hermes。国立墨西哥大学 • SUMSearch。美国得克萨斯保健科学中心大学
3国外的一些相关研究情况 • 图书馆自动化系统产商产品 • EnCompass (Endeavor, MuseSearch) • Horizon Consolidated Searching (Dynix, WebFeat) • MetaFind (Innovative, MuseSearch) • MetaLib (ExLibris) • One Search (Follett, WebFeat) • SingleSearch (Sirsi, MuseSearch)
3国外的一些相关研究情况 • 国外研究及系统的主要特点 • 跨库检索系统一般都支持通过HTTP协议检索数据源和获取检索结果,这一点与一般的元搜索机制大体相似,但跨库检索更注意检索协议,如Z39.50等协议的应用; • 检索仅仅是信息服务的起点,跨库检索需要将资源和服务实现链接,如链接到电子期刊,链接到原文传递等; • 为了方便用户的使用,跨库检索系统一般提供定制功能和收藏夹功能,使用户能够重复使用其检索到的数据; • 在有些跨库检索系统中,提供了检索词前期规范,如NLM Gateway和SiteSearch都提供了通过词表进行检索词规范的功能。
4 CrossSearch系统建设情况 • “CrossSearch跨库集成检索系统”是中国科学院文献情报中心承担的国家科学数字图书馆建设项目“基于元搜索的网络数据库集成检索系统”项目的研究成果
4 CrossSearch系统建设情况 • “基于元搜索的网络数据库集成检索系统”项目的研究目标 • 调研、综述有关国内外集成检索系统的现状及趋势研究报告; • 提出国家科学数字图书馆集成检索系统采用的技术标准、系统设计方案; • 研制国家科学数字图书馆集成检索系统,并及时提供集成检索服务; • 发表本课题调研和研究等有关学术论文。 • “基于元搜索的网络数据库集成检索系统”项目从2002年下半年启动
4 CrossSearch系统建设情况 • “CrossSearch跨库集成检索系统” 在2003年初开始提供服务,最初发布的版本只支持8个数据库的检索。
4CSDL“CrossSearch跨库集成检索系统”项目的建设情况4CSDL“CrossSearch跨库集成检索系统”项目的建设情况 • 经过不到一年的努力, CrossSearch跨库集成检索系统经过3次改版。 • 目前集成了丰富的资源,可以分为6类近百种不同来源、不同结构的数据资源。 • 集成的数据源主要包括CSDL购买的全文数据数据库、文摘索引数据库、电子图书资源、网络免费资源、联合目录资源和国内外重要的OPAC资源。
5 CrossSearch的主体框架 • CrossSearch的6个核心组件 • 统一检索入口 • 检索请求处理模块 • 各协议连接器引擎 • 特定资源的各协议连接器(HTTP连接器,Z39.50连接器,OAI连接器) • 检索结果处理模块 • 结果呈现模块
总控管理 用户界面 检索参数定制 资源定制 检索结果保存 用户管理 Session管理 认证管理 日志管理 统一检索入口 统一格式结果反馈 针对特定资源的元数据 结果格式转换配置文件 检索请求处理API 连接器引擎 API 检索结果处理API 检索请求处理模块 各协议连接器引擎 检索结果处理模块 HTTP连接器 Z39.50连接器 JDBC连接器 OAI连接器 Internet数据源 Z39.50服务器 本地数据库 OAI服务器
5 CrossSearch的主体要特点 • 1一站式的信息检索 • 用户只需通过一个统一的检索界面,就可以同时对多个数据源(网络数据库)进行检索,简化了多数据源检索的过程,节省了用户查找信息的时间。
5 CrossSearch的主体要特点 • 2多数据源的检索集成 • 目前,系统已集成了6类、近百种不同来源、不同结构的数据源,基本上覆盖CSDL购买的网络资源。 • 集成的数据源主要包括全文数据数据库、文摘索引数据库、电子图书资源、网络免费资源、联合目录资源和国内外重要的OPAC资源。
5 CrossSearch的主体要特点 • 2多数据源的检索集成 • 全文数据库 • 系统目前提供16种网络全文数据库的检索集成,分别是维普科技期刊全文数据库、Springer-Link电子期刊、Science Online、ProQuest博士论文全文数据库、Nature、Johnwiley、IOP(Institute of Physics)、IEL(IEEE/IEE)、HighWire、Elsevier ScienceDirect、DOAJ(Directory of Open Access Journals)、CellPress、APS(American Physical Society)、AIP(American Institute of Physics)、ACS(American Chemical Society)、ACM(Association for Computing Machinery)
5 CrossSearch的主体要特点 • 2多数据源的检索集成 • 文摘索引数据库 • 系统提供11种文摘/索引数据库的检索集成,分别是中科院学位论文库、馆藏西文会议论文库、SCI、RSC(Royal Society of Chemistry)、ISTP、INSPEC、Ingenta、EI Village、Cambridge University、BP(BIOSIS Previews)、ASME(American Society of Mechanical Engineers)
5 CrossSearch的主体要特点 • 2多数据源的检索集成 • 电子图书资源 • 集成了方正电子图书、Springer电子丛书、Springer LB电子工具书、Knovel网络版电子工具书,共4种数据库。 • 网络免费资源 • 系统目前提供对Google和Yahoo!的集成检索服务。
5 CrossSearch的主体要特点 • 2多数据源的检索集成 • 联合目录资源 • 包括中科院联机联合目录数据库、全国中日俄西文期刊联合目录库、广东省文献编目中心、地方版文献联合采编协作网,共4种数据库。
5 CrossSearch的主体要特点 • 2多数据源的检索集成 • OPAC库资源。 • 系统目前提供对国内外54种OPAC数据库的集成检索,如中科院图书馆、国家图书馆、北京大学图书馆、清华大学图书馆、中国人民大学图书馆、美国国会图书馆、加拿大国家图书馆、 Ohio LINK、苏格兰国家图书馆、牛津大学图书馆、丹麦阿伯格大学图书馆、丹麦阿伯丁大学图书馆、丹麦Arhus科技书目、丹麦Arhus公共图书馆书目、澳大利亚 Defence Force Academy Library、Michigan State University Library、Australian National University Library等。
5 CrossSearch的主要特点 • 3检索结果的统一呈现 • 系统自动合并不同数据源的检索结果,并支持二次检索,实现了真正意义上的信息整合与检索结果统一呈现。 • 多种预设功能。可以对检索字段、去重标准、排序标准、显示记录条数等进行预先设定。 • 多种结果显示。简单、详细 • 多种排序方式。题名、数据库、作者 • 多种查重手段。三种查重方式。 • 支持二次检索。系统支持用户在原有检索结果的基础上进行二次检索。
5 CrossSearch的主要特点 • 4个性化的资源定制 • 系统支持个性化定制,用户登录到跨库集成检索系统后,可以定制自己常用的数据库资源,构成多个资源组。下次检索时,系统默认在用户定制的资源中进行检索。
5 CrossSearch的主要特点 • 5检索和服务的集成 • 跨库集成检索系统与原文传递服务无缝连接,支持原文传递功能。不具有全文使用权限的用户可以通过该系统获取所需资源的全文。
5 CrossSearch的主要特点 • 6 动态的数据源扩展 • 系统采用动态的资源管理机制,管理员只需填写工作表单,就可动态地集成新的数据源,整体架构具有良好的可扩展性。
5 CrossSearch的主要特点 • 7 便利的应用情况统计 • 系统提供多种应用统计,例如数据库使用统计、原文请求统计、原文请求处理统计等,方便管理员了解各种网络数据库的应用情况,明确用户的使用需求。
欢迎访问我们的系统 • 项目情况介绍完毕 • 在报告完成之后我们留下了点时间,各位嘉宾可以到演示区试用本系统 • http://cross.csdl.ac.cn/
谢谢 • 问题?