900 likes | 1.16k Vues
Lecture 15. 复杂网络. 2011.5. 讲授内容. 图论与复杂网络 生物复杂网络与主要类型 蛋白质 - 蛋白质相互作用 蛋白质 - 蛋白质相互作用数据库 蛋白质 - 蛋白质相互作用研究主要算法 蛋白质 - 蛋白质相互作用研究示例 途径数据库 蛋白质结构可视化工具与相互结合 未来研究展望. 1 图论与复杂网络. 基本概念. 前言. 我们生活在一个充满形形色色网络的多彩世界里 例如,高速公路网、铁路网、电力网格、电信网、互联网 生物网络:神经网、食物网、流行病传播网. Where‘s George 网绘美境内现金流网络. 人际关系网.
E N D
Lecture 15 复杂网络 2011.5
讲授内容 • 图论与复杂网络 • 生物复杂网络与主要类型 • 蛋白质-蛋白质相互作用 • 蛋白质-蛋白质相互作用数据库 • 蛋白质-蛋白质相互作用研究主要算法 • 蛋白质-蛋白质相互作用研究示例 • 途径数据库 • 蛋白质结构可视化工具与相互结合 • 未来研究展望
1 图论与复杂网络 基本概念
前言 • 我们生活在一个充满形形色色网络的多彩世界里 • 例如,高速公路网、铁路网、电力网格、电信网、互联网 • 生物网络:神经网、食物网、流行病传播网
关于图论 • 图论是一个古老的但又十分活跃的分支,它是网络技术的基础。 • 图论的创始人是瑞士数学家欧拉(L. Euler)。 • 1736年,欧拉发表了图论方面的第一篇论文,解决了著名的哥尼斯堡七桥难题。 • 一百年后,在1847年基尔霍夫第一次应用图论的原理分析电网,从而把图论引进到工程技术领域。
图论的发展 • 20世纪50年代以来,图论的理论得到了进一步发展,将很多复杂庞大的工程系统和管理问题用图描述,可解决工程设计和管理决策的最优化问题。 • 例如,完成工程任务的时间最少,距离最短,费用最省等等。 • 目前,图论在数学、工程技术、经营管理、生物信息学等各方面受到越来越广泛的重视。
图论是运筹学的分支 • 运筹学包括:数学规划(线性规划,非线性规划,整数规划,组合规划等)图论、网络流、决策分析、排队论可靠性数学理论、库存论、对策论搜索论、模拟计算等等
图的基本类型 有向图 无向图 权重无向图
复杂网络 • 复杂网络即结构呈现高度复杂性的网络。 • 我们面临的网络基本上都是复杂网络。 • 主要参考文献(建议阅读)Steven H.Strogatz. Exploring complex networks. Nature, 410(8):268-276, 2001
2 生物复杂网络与主要类型 基本概述
生物网络研究范围 • 目前,生物网络通常指局限于单个生物体内的、分子水平的研究。 • 数据和信息的获取:主要搜集来自于通过实验的反应或相互作用联系在一起的特定生物分子。 • 利用组分(信号、转录、相互作用等)作用方法取得网络的一致性。
生物网络主要研究类型 • 信号网络 • 代谢网络 • 基因调控网络 • 蛋白质相互作用网络
信号网络 • 细胞内部的有序系列事件:输入和输出,时间和空间域。 • 细胞内常常充斥着干扰(噪音):难以获得清晰有条理的理想图或表。 • 在个体的不同组织类型中具有不同的信号途径,使得信号网络的研究更趋于复杂化。
信号网络: 研究经由时间和空间的细胞内的活化电位
代谢网络 • 主要研究目标:代谢途径中的可测产物。 • 代谢网络的主要特点: • 多数代谢网络是稳态的。 • 代谢途径中的关键节点是可控节点。 • 在代谢网络中存在负反馈有助于系统的稳定。 • 对绝大多数代谢途径的研究适用于数学分析手段。
Boehringer-Mannheim 资源管理表 代谢网络 化学变化网络Networks of chemical change http://us.expasy.org/
image credit: U.S. Department of Energy Genomes to Life Program, http://doegenomestolife.org. 基因调控网络
基因调控网络 • 很多元素可以调控基因产物浓度,主要包括cDNA、mRNA、蛋白质、小分子等 • 核酸-核酸,蛋白质-核酸相互作用。 • 对表型差异非常敏感:基因表达变化巨大,不仅仅在物种之间,可以在同一物种的成员之间。 • 可能是研究的最为复杂的网络之一。
Eric H. Davidson,Jonathan P. Rast Paola Oliveri,Andrew Ransick,Cristina Calestani, Chiou-Hwa Yuh, Takuya Minokawa, Gabriele Amore,Veronica Hinman, Ce´sar Arenas-Mena, Ochan Otim, C. Titus Brown, Carolina B. Livi,Pei Yun Lee, Roger Revilla, Alistair G. Rust, Zheng jun Pan, Maria J. Schilstra, Peter J. C. Clarke,Maria I. Arnone, Lee Rowen, R. Andrew Cameron, David R. McClay, Leroy Hood, Hamid Bolouri A Genomic Regulatory Network for Development. Science, 2002, 295 1669-1678 建议阅读
蛋白质相互作用网络 • 蛋白质的复合体:功能相互作用蛋白质的定位,或参与特定生物活动的蛋白质-蛋白质相互作用 (例如,小泡结合)。 • 实验方法对相互作用网络的研究常常会导致假阳性或假阴性的产生。 • 在所有生物网络中,相互作用网络可能是最为“模糊化的”。
蛋白质相互作用: 功能复杂性的描述 Lethality and centrality in protein networks H. JEONG, S. P. MASON, A.-L. BARABÁSI & Z. N. OLTVAI Nature411, 41 - 42 (2001); doi:10.1038/35075138
生物网络间的关系: 每个 “网络” 都是人工网络依据功能、仅仅依据功能来定义网络, 所有网络是相互关联的
3 蛋白质-蛋白质相互作用 内容概述
相关内容 • 蛋白质-蛋白质相互作用背景 • 相互作用的重要性 • 蛋白质相互作用技术对其它领域的影响 • 蛋白质相互作用类型 • 蛋白质相互作用研究方法
蛋白质-蛋白质相互作用背景 • 蛋白质控制细胞的活性,并作为引起细胞生物活性的媒介 • 一个细胞不是静态的 形状在变化 分裂 代谢 • 不同类型的细胞具有不同的意义 淋巴细胞 神经细胞
蛋白质-蛋白质相互作用的重要性 一信号蛋白与另一蛋白结合可能有系列不同结果 : • 这种结合可以使得一个信号蛋白在某个位置具备活性,或者在某个位置执行其功能。 • 两个蛋白质的结合导致构象的改变,从而影响活性、或者更易于接近其它的结合域,允许附加的蛋白质相互作用。
蛋白质-蛋白质相互作用的重要性 • 设想在一个细胞中,突然蛋白质间的特定相互作用消失了。这个不幸的细胞将变的又“聋”又“盲”,随即瘫痪,最终裂解。 • 特定的相互作用几乎包含在所有的生理学过程中。
相互作用研究对其它领域的影响 • 肿瘤生物学 对蛋白质-蛋白质相互作用的研究有助于深入了解许多已知的原癌基因、肿瘤抑制因子和DNA修复蛋白群的功能。 • 药物遗传学 药物遗传学研究已经扩展到包括对药物输送、药物受体和药物靶标的研究。 注:药物遗传学(pharmacogenetics)是生化遗传学的一个分支学科,它研究遗传因素对药物代谢动力学的影响,尤其是在发生异常药物反应中的作用。
蛋白质相互作用类型 • 二元蛋白质相互作用 • 支架蛋白质 • 多元蛋白质相互作用 http://www.udel.edu/chem/bahnson/chem667/crotty/scaffolding_proteins.html#scaffolding
蛋白质相互作用类型—其他分类方式 • 代谢和信号途径 。 • 发育过程中,参与相同细胞功能的蛋白质群的形态形成途径。 • 大量高分子聚合的结构复合物和分子机。
数据库开发背景 • 近年蛋白质技术的快速发展,诸如双杂交技术、噬菌体展示技术和质谱技术,使得我们有可能创建生物分子相互作用网络的详细图谱。 • 初步的图谱制作已经获得了大量的数据。随着相互作用数据集的增长,需要研发专门的数据库和计算方法,用于数据的存储、可视化和信息的分析,便于知识的有效发现。 • 蛋白质-蛋白质相互作用的网络数据资源很多,下面罗列了部分资源: • BIND (Interaction Network Database) • DIP (Database of Interacting Proteins) • Protein-Protein Interaction Server • Protein-Protein Interface
示例:什么是DIP? • 蛋白质相互作用数据库 • 1999 年在 UCLA建立 • 最初目的 extract and integrate protein-protein info and build a user-friendly environment.
DIP数据库的使用 用于研究 • Protein function • Protein-protein relationship • Evolution of protein-protein interaction • The network of interacting proteins • The environments of p-p interactionspredict • Unknown protein-protein interaction • The best interaction conditions
DIP的结构 Protein Table Method Table Interaction Table Reference Table
DIP数据现状 • Number of proteins 19344 • Number of organisms 154 • Number of interactions 56048 • Number of distinct experiments describing an interaction 63168 • Number of data sources (articles) 3213 • Number of data sources (other) 34
相关卫星数据库 • DLRP (http://dip.doe-mbi.ucla.edu/dip/DLRP.cgi) - Database of Ligand-Receptor Partners • LiveDIP(http://dip.doe-mbi.ucla.edu/ldipc/tmpl/livedip.cgi) - data of the protein states and state transition in protein-protein interaction. • JDIP - a stand-alone Java application that provides a graphical, browser- independent interface to the DIP database.
主要蛋白质数据库和蛋白质相互作用数据库(1)主要蛋白质数据库和蛋白质相互作用数据库(1)
主要蛋白质数据库和蛋白质相互作用数据库(2)主要蛋白质数据库和蛋白质相互作用数据库(2)
蛋白质相互作用预测算法 • 预测蛋白质的相互作用是目前生物信息学中最具挑战性的研究。 • 计算预测效率高、花费少。 • 常见算法分类:1)基于基因组信息方法;2)基于进化关系的方法;3)基于蛋白质序列的从头预测方法;4)基于三维结构信息的方法。
蛋白质相互作用重要算法 • 系统发育谱法 • 基因邻接法 • 基因融合法 • 镜像树法 • 突变关联法 • 进化速率关联法 • 基于保守蛋白质相互作用的方法 • 基于蛋白质一级结构信息的预测方法 • 基于蛋白质三维结构信息的预测方法
电子版的全文可以在该网址获得: http://www.biomedcentral.com/1471-2105/4/2 MCODE算法 一个在大型蛋白质相互作用网络中自动寻找分子复合体的方法 MCODE 算法的操作步骤分三个阶段: 顶点加权复合体预测随意后加工(基于特定连通性准则在已获得的复合体 中过滤或增加蛋白质)
蛋白质相互作用进展 • 分子公共知识数据库pSTIING刚刚面世(2006)。 • 欧洲生物信息学研究院和人类蛋白质组学组织(HUPO)联合启动蛋白质相互作用和其他蛋白质组学数据研究。 • Stelzl U 等(2005)发布了首个人类蛋白质组相互作用图谱。 • 美国学者2006年在Nature上公布了蛋白质相互作用图谱。为进一步蛋白质间相互作用提供了技术支持和可参照系,将大大推动对人类蛋白质组网络的认知。