1 / 84

生物信息学实验

生物信息学实验. 实习 1 : 常用生物信息中心浏览及查询 一、 实习目标: 1 、了解 NCBI 、 DDBJ 、 EMBL 上网的方法自学各网站相关介绍。 2 、了解北大生物信息学中心等几大中文生物信息学网站。 3 、利用 NCBI 的 Entrenz 查询系统和 EBI 的 SRS 检索文献和核酸或蛋白质 序列。 1 、生物信息学网站浏览. NCBI 输入网址 (http://www.ncbi.nlm.nih.gov/). http://www.ncbi.nlm.nih.gov/.

lilika
Télécharger la présentation

生物信息学实验

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 生物信息学实验

  2. 实习1:常用生物信息中心浏览及查询 一、 实习目标: 1、了解NCBI、DDBJ、EMBL上网的方法自学各网站相关介绍。 2、了解北大生物信息学中心等几大中文生物信息学网站。 3、利用NCBI的Entrenz查询系统和EBI的SRS检索文献和核酸或蛋白质序列。 1、生物信息学网站浏览

  3. NCBI 输入网址(http://www.ncbi.nlm.nih.gov/) http://www.ncbi.nlm.nih.gov/

  4. 2)European Molecular Biology Laboratory输入网址:http://www.ebi.ac.uk/embl/

  5. 3) DDBJ (DNA Data Bank of Japan )输入网址:http://www.ddbj.nig.ac.jp/

  6. 4)北大生物信息学中心 网页

  7. 2、查询 1)Entrez (http://www.ncbi.nlm.nih.gov/Entrez/)查询 (1)查询编码拟南芥(arabidopsis)phyE(光敏色素E)基因的核酸序列 选择gene 输入arabidopsis phyE

  8. 点击下图1标题phytochrome E那一行

  9. arabidopsis phyE(光敏色素E)基因位于的染色体 由网页可知该基因位于拟南芥: Arabidopsis thaliana chromosome 4

  10. (2)查询编码拟南芥(arabidopsis)phyE(光敏色素E)基因的核酸序列(2)查询编码拟南芥(arabidopsis)phyE(光敏色素E)基因的核酸序列 选中: nucleotide 输入: arabidopsis phyE

  11. 点击右下角Arabidopsis thaliana(29)

  12. 点击3标题搜索结果

  13. 由搜索结果知: 序列编号: ACCESSION : NM_117923 碱基 : 3648 bp

  14. 点击FASTA, huo

  15. 编码拟南芥(arabidopsis)phyE(光敏色素E)基因mRNA的Fasta格式序列编码拟南芥(arabidopsis)phyE(光敏色素E)基因mRNA的Fasta格式序列

  16. 点击该处显示蛋白质的编码信息 点击该网页中的 NP-193547.4 获得其蛋白质的序列

  17. 获得蛋白质:LOCUS NP_193547 1112 aa linear PLN 28-MAY-2011可知氨基酸数目:1112aa

  18. 由记录查找过程知: 该基因位于拟南芥的第四条染色体上 由3648碱基构成;编码1112个氨基酸。 accession号是多少? arabidopsis phyEmRNA的accession号:NM_117923

  19. (2)查询ID号为AAH05255的蛋白质序列并最终获得它的Fasta格式序列(2)查询ID号为AAH05255的蛋白质序列并最终获得它的Fasta格式序列

  20. AAH05255的蛋白质 它来源于什么物种? Homo sapiens (human) 包含有多少个氨基酸? 110aa 是什么蛋白? Protein 1..110 /product=“insulin” (胰岛素)

  21. 由搜索结果知:Protein 1..110 /product=“insulin” (胰岛素)

  22. AAH05255的蛋白质的Fasta格式序列

  23. 3)查询一篇关于phyA的查考文献 选中: Pubmed 输入: Arabidopsis phyA

  24. 有关phyA的一篇文献

  25. 文献名称:Arabidopsis phytochrome a is modularly structured to integrate the multiple features that are required for a highly sensitized phytochrome. 作者名字:Oka Y, Ono Y, Toledo-Ortiz G, Kokaji K, Matsui M, Mochizuki N, Nagatani A 杂志名称: Plant Cell. 出版日期:2012 Jul;24(7):2949-62. Epub 2012 Jul 27.

  26. 实习二 BLAST和Fasta的使用 一、实习目标 1.掌握BLAST的基本功能并可熟练使用 2.了解FastA的基本功能及使用方法 1.BLAST 用NCBI中的BLAST在线工具搜索与其相匹配的序列。

  27. 点击进入NCBI的主界面,点BLAST

  28. 点击Basic BLAST下的protein blast

  29. 浏览,选中文件中名为Rho文件

  30. 搜索结果如下:

  31. BLAST结果逐条显示

  32. 由网页结构显示:accession NP_000530.1的序列相识度最高为100%

  33. 点击第一条进入NP_000530.1

  34. 点击GENE ID: 6010 RHO获得其序列信息

  35. 搜索的序列来自于Homo sapiens的rhodopsin(视紫红质)相似度到达100%

  36. 实习三 基因预测—Genscan 和ORF Finder 一 实习目标: 1、掌握ORF Finder对原核生物基因组进行基因预测。 2、能够利用genscan进行基因预测。 3、能够对预测的结果进行分析。 1. Genscan的使用 1.1、从NCBI下载基因序列核酸序列,保存其fasta格式到记事本(H.sapiens ENO3)

  37. NCBI下载H.sapiens ENO3基因序列核酸序列

  38. H.sapiens ENO3基因序列核酸序列其fasta格式

  39. 2.使用genscan进行基因预测:输入网址:http://genes.mit.edu/GENSCAN.html2.使用genscan进行基因预测:输入网址:http://genes.mit.edu/GENSCAN.html Organism选中: Vertebrate Print option选中: Predicted CDS and peptide 将搜索到的H.sapiens ENO3基因序列核酸序列输入到方框内

  40. Predict genes/exons结果输出 起始位置、终止位置 该基因起始外显子从1624碱基处开始,到1708碱基处结束;接着有7个中间外显子;终止外显子在6837碱基处结束,其后还有polyA信号 起始外显子 中间外显子 终止外显子

  41. H.sapiens ENO3所编码的蛋白质序列

  42. H.sapiens ENO3基因的CDS

  43. 2. ORF Finder 的使用 1.到ORF Finder进行基因预测 要求:通过简单的文字描述和图片记录预测过程;分析预测结果:预测出Rickettsia conorii 包含多少个长度大于300bp 的基因?列举几个它们在基因组中的起始终止位置?是正链还是负链?长度是多少?它们分别编码多少个氨基酸?有无重叠基因?(提示:列表说明)

  44. 输入网址:http://www.ncbi.nlm.nih.gov/gorf/gorf.html进入以下界面:输入网址:http://www.ncbi.nlm.nih.gov/gorf/gorf.html进入以下界面:

  45. Mycoplasma capricolum 基因组核酸序列预测结果:

  46. 点击(例子1) 无重叠序列

  47. 点击(例子2) 有重叠序列

  48. 点击(例子3) 有重叠序列

More Related