300 likes | 491 Vues
基于语义网格的语义关联存储模型及管理和通信平台. 金 海 集群与网格计算湖北省重点实验室 华中科技大学. 汇报提纲. 2005 年研究进展情况 语义网格存储概念结构 主要研究内容和进展 论文发表情况 基于语义网的语义关联存储管理平台开发进展 应用系统介绍 SemreX: 文献元数据信息共享应用 总结. 语义网格存储概念结构. 基于语义的自组织 语义网格拓扑结构 高效语义信息搜索. 网格数据存储. 基于本体的网格 语义信息提取. 本体的半自动定义 本体更新和映射. 2005 年主要研究内容. 语义关联存储模型研究 基于语义的存储及语义关联存储
E N D
基于语义网格的语义关联存储模型及管理和通信平台基于语义网格的语义关联存储模型及管理和通信平台 金 海 集群与网格计算湖北省重点实验室 华中科技大学
汇报提纲 • 2005年研究进展情况 • 语义网格存储概念结构 • 主要研究内容和进展 • 论文发表情况 • 基于语义网的语义关联存储管理平台开发进展 • 应用系统介绍 • SemreX:文献元数据信息共享应用 • 总结
语义网格存储概念结构 基于语义的自组织 语义网格拓扑结构 高效语义信息搜索 网格数据存储 基于本体的网格 语义信息提取 本体的半自动定义 本体更新和映射
2005年主要研究内容 • 语义关联存储模型研究 • 基于语义的存储及语义关联存储 • 本体的半自动定义 • 基于本体的信息提取 • 语义相似度 • 基于主动存储的语义网格计算模型 • 基于语义相似度的语义网格自组织拓扑结构 • 基于语义的高效网格资源搜索机制 • 基于语义的网格资源自主探测和更新
基于语义的数据存储 • 基于语义网技术的数据存储趋势( OntoWeb ) • 对RDF/S支持远多于对标准本体语(DAML+OIL)的支持 • 大多数的查询语言是基于三元组的 • 大多数工具基于关系技术(对象或者关系数据库)来存储数据 • 目前存在的主要问题 • 工具不成熟 • 缺乏可扩展性 • 查全、查准等性能指标不高
语义关联存储 • 语义关联 • 语义相似度及语义相关度 • 分布 • 利用网格和对等网技术来增强语义存储的可扩展性 • Edutella实现了基于p2p的RDF元数据网络(www’02) • 结合传统的数据库索引机制如B+树,来索引分布数据库,优化分布架构
语义关联存储所涉及的技术 • 本体定义 • 信息提取 • 信息分类 • 语义相似度及语义相关度
本体的自动及半自动定义 • 网格中存在大量异构的元数据可采用本体方法表示和存储 • 人工定义本体开销非常大,要求能自动或人工辅助半自动定义本体 • 运用机器学习、数据挖掘等技术创建新本体, 使本体具有自学习功能
定义本体的方法 • 自顶向下 • 人工构建上层本体 • 运用机器学习、数据挖掘等技术创建新的概念 • 比较语义相似度并检测概念冲突,构建新本体 • 自底向上 • 对于大量的元数据采用核心本体表示 • 合并核心本体并形成上层本体
基于本体的信息提取 • 信息提取 • 信息从无结构到有结构 • 从自然语言到机器可识别 • 传统的信息提取技术 • 基于规则的方法:模式匹配、模板库 • 机器学习的方法:HMM、SVM等 • 弊端: 缺乏对提取出的实体之间联系的领域知识的识别能力 • 本体提供机器可识别的领域概念知识及其联系
基于本体的信息提取 • 广域网中文档数据信息的一致性 • 信息抽取的特异性 • 实体以及实体间联系的自动识别
面向任务的本体 Ontology 无结构、 半结构化的文档 信息抽取工具 P2P WWW 知识库 知识库 知识库 基于本体的信息抽取 智能搜索引擎 …
基于本体的资源分类 • 资源分类结合知识管理、数据挖掘、机器学习以及信息检索等方面技术 • 研究方法 • 对网格数据提取语义特征向量,运用数据挖掘、信息检索中潜在语义索引(LSI) 等技术 • 根据语义特征向量对数据进行基于本体的分类,结合kNN、支持向量机、贝叶斯概率等分类方法
本体的自动定义和资源分类 本体自学习 异构资源 本体设计和编辑 特征提取 分类系统 本体冲突检测 本体 基于本体的资源数据库 具有自学习功能的本体 基于本体的资源数据库
语义相似度 • 存储结点之间的相似度 • 定义对象的语义相似度 • 网格存储结点之间的相似度 • Query语句和网格存储结点之间的语义相似度
Grid Node B Grid Node A ... ... ... ... ... ... ... ... ... ... 存储结点之间的相似度
Grid Node Query < rdf : type > SemreX : Paper Sentence < SemreX : isAbout > ACMTopic / Software / Operating _ Systems Paper < SemreX : Year > ... 2005 < SemreX : author > Author SELECT Author , Paper ... FROM ... { Paper } rdf : type { SemreX : Paper }; ... ... SemreX : Topic { acm : ACMTopic / Software / Operating _ Systems }; SemreX : Year { 2005 }; “ ” SemreX : author { Author } USING NAMESPACE SemreX = < http :// grid . hust . edu . cn / semantic / SemreX / 1 . 0 / >, acm = < http :// daml . umbc . edu / ontologies / classification # > 语义Query语句和存储结点之间的语义相似度
基于语义相似度的语义网格自组织结构 • 基于存储结点语义相似度的网格存储结点自组织结构 • 基于语义相似度的网格资源高效信息搜索机制
基于语义的网格结点资源的主动存储 • 网格中基于语义的主动存储 • 代理主动发现、监控和管理本地资源的状况,更新本地语义知识库中的内容 • 代理将语义知识库更新广告发送给邻居结点,主动更新路由信息
2005年论文发表情况-期刊文章(1) • Hai Jin, Xuanhua Shi, Weizhong Qiang, and Deqing Zou, “DRIC: Dependable Grid Computing Framework”, IEICE Transactions on Information and Systems, 2006 • Hai Jin, Xuanhua Shi, Weizhong Qiang, and Deqing Zou, “An Adaptive Meta-Scheduler for Data-Intensive Applications”, International Journal of Grid and Utility Computing, Vol.1, No.1, 2005, pp.32-37 • Hai Jin, Weizhong Qiang, Xuanhua Shi, and Deqing Zou, “RB-GACA: A RBAC based Grid Access Control Architecture”, International Journal of Grid and Utility Computing, Vol.1, No.1, 2005, pp.61-70
2005年论文发表情况-期刊文章(2) • 金海, 陈汉华, 宁小敏, 袁平鹏, 武浩, 郭志鑫,“SemreX 系统中一种基于语义相似度的Peer-to-Peer拓扑及路由算法”,《软件学报》,2006 • 郭志鑫,金海,陈汉华,“SemreX中基于语义的文档参考文献元数据信息提取”,《计算机研究与发展》,2006 • 金海, 陈汉华, 吕志朋,宁小敏, “CGSP作业管理器的合成服务的QoS优化模型及求解”, 《计算机学报》, 2005年,第28卷,第4期,pp.578-588 • 金海, 武浩, 李运发, 陈汉华, “OntoSLAt:基于本体构建的SLA模板知识库”, 《小型微型计算机系统》, 2005
2005年论文发表情况-会议文章(1) • Yijiao Yu and Hai Jin, “Building a Semantic P2P Scientific References Sharing System with JXTA”, APWeb’06 • Hai Jin, Hao Wu, Yunfa Li, and Hanhua Chen, “An Approach for Service Discovery based on Semantic Peer-to-Peer”, ASIAN’05 • Hai Jin, Xiaoming Ning, Hanhua Chen, and Zuoning Yin, “Efficient Query Routing in Semantic Overlays Based on Latent Semantic Indexing”, SKG’05 • Yijiao Yu and Hai Jin, "An Ontology-based Host Resources Monitoring Approach in Grid Environment”, WAIM’05
2005年论文发表情况-会议文章(2) • Hongbo Zou, Zongfen Han, Hai Jin, Jing Tie and Xuanhua Shi, “A Virtual-Service-Domain Based Bidding Algorithm for Resource Discovery in Computational Grid”, WI’05 • Hai Jin and Hao Wu, “Semantic-based Specification for Web Service Agreement”, NGWSP'05 • Xuanhua Shi, Hai Jin, Zongfen Han, Weizhong Qiang, Song Wu, Deqing Zou, “ALTER: Adaptive Failure Detection Services for Grids”, SCC’05 • Hai Jin, Hanhua Chen, Zhipeng Lu and Xiaoming Ning, "Q-SAC: Toward QoS Optimized Service Automatic Composition", CCGrid’05 • Hanhua Chen, Hai Jin, Feng Mao, and Hao Wu, “Q-GSM: QoS Oriented Grid Service Management”, APWeb’05
应用系统-文献元数据共享 • 基于语义的文献元数据提取 • 在线文档的获取 • 在给定的领域本体下,提取有效信息 • 基于语义的文献元数据关联存储 • 将文献元数据基于语义相似度存储在知识库中 • 基于语义的路由信息发布 • 基于语义的文献搜索 • ……
总结 • 2005年研究内容基本完成 • 语义关联存储研究 • 基于主动存储的语义网格计算模型 • 发表/录用论文16篇 • 基于语义网的语义关联存储管理平台开发(开发ing) • 中期检查应用系统框架基本完成 • SemreX:文献元数据信息共享应用