260 likes | 430 Vues
A5 GENES. Structure of genes Gene families The central dogma Gene structure. 一、基因概念的发展. 1865年 “ 遗传因子 ”. 1909年 “ 基因 ”. 1910年 “ 定位于染色体上 ”. 1926年《基因论》. 1944年 “ 转化实验 ”. 基因的化学本质是 DNA. 1952年 “ T2 噬菌体侵染实验 ”. 1908年 “ 苯丙酮尿症 ”. 1941年 “ 一个基因一种酶 ”. 顺反子学说: “ 一个基因一条多肽链 ”. 1978年 内含子与外显子、重叠基因.
E N D
A5 GENES • Structure of genes • Gene families • The central dogma • Gene structure
一、基因概念的发展 1865年“遗传因子” 1909年“基因” 1910年“定位于染色体上” 1926年《基因论》 1944年“转化实验” 基因的化学本质是DNA 1952年“T2噬菌体侵染实验” 1908年“苯丙酮尿症” 1941年“一个基因一种酶” 顺反子学说:“一个基因一条多肽链” 1978年 内含子与外显子、重叠基因 1977年“断裂基因” 1961年“操纵子”学说 1967年“插入序列” 1951年“转座子”的概念
GENE is a discrete DNA sequence that encodes the amino acid sequence of a polypeptide;also could be a RNA nucleotide sequence • Genes vary in size from less than 100 base pairs to several million base pairs. 基因的大小差别可以很大 • The genes are very dispersed and are separated by extragenic DNA (不同基因的之间排列比较分散,多数情况不相连).
基因外区域 假基因 Figure 1. Gene in DNA molecule
2. Gene families • Some genes are organized into groups or clusters, which are called operons(操纵子)and multigene families(多基因家族). 基因也可能存在连续分布或集中分布的现象 • In an operon, genes are regulated in a coordinated way and encode proteins with closely related functions. • genes in a multigene family are identical or very similar and are not regulated coordinately. • Simple and complex multigene families
Figure 2. The lac operon. Three genes (Lac Z, Y and A) are arranged and regulated together
Ribosomal RNA genes Intergenic DNA (a) Simple multigene family Figure 3. Multigene family
3. Gene expression • Gene expression is the process by which information stored in the base sequence of DNA molecule is made available to the cell. • Central dogma, originally proposed by Crick, states that information is transferred from DNA to RNA to protein, which are named transcription and translation respectively.
Reverse transcription(反转录): occur in retrovirus;enzyme called reverse transcriptase;以 RNA 为模板合成 DNA.
二、基因的一般结构特征 • (一)外显子与内含子 • (二)侧翼序列和调控序列
内含子边界3’AG 5’非编码区 信号肽序列 加帽位点5’m2GpppNp 内含子 终止密码子 加poly(A)信号 起始密码子 外显子 TATA盒 GC盒 内含子边界5’GT 3’非编码区 AGGA或CAAT盒 真核生物基因的一般结构示意图 终止子 启动子区域
(一)外显子与内含子 图示 • 真核生物结构基因是断裂基因,一般由若干个外显子和内含子组成。 • 内含子在原始转录产物的加工过程中被切除,不包含在成熟mRNA的序列中。 • GT-AG法则: 在每个外显子和内含子的接头区,有一段高度保守的共有序列,即每个内含子的5‘端起始的2nts都是GT,3’末端的2nts都是AG。
(二)侧翼序列和调控序列 图示 • 侧翼序列就是侧翼基因,是指在第一个和最后一个外显子的外侧,都有一段不被转录翻译的非编码区。 • 其中从转录起始位点至起始密码子称为5’非翻译区/5’非编码区(UTR),从终止密码子至转录终止子称为3’非翻译区/3’非编码区(UTR)。
侧翼序列虽不被转录和翻译,但它常常含有影响基因表达的DNA序列。对基因的有效表达起着调控作用的特殊序列被统称为调控序列.侧翼序列虽不被转录和翻译,但它常常含有影响基因表达的DNA序列。对基因的有效表达起着调控作用的特殊序列被统称为调控序列. • 包括启动子、增强子、绝缘子、终止子、核糖体结合位点、加帽和加尾信号等。
(三)侧翼序列和调控序列 图示 • 1、启动子 • 2、增强子和沉默子 • 3、终止子 • 4、加尾信号 • 5、核糖体结合位点
1、启动子★ 图示 • 是指准确而有效地启始基因转录所需的一段特异的核苷酸序列。 • 转录起始位点(+1位)下游区域为正区,上游区域为负区。 • 启动子通常位于转录起始位点上游100bp(-100bp)内,是RNA聚合酶识别和结合的位点。 • 真核生物,含TATA框和CAAT框、GC框 • 原核生物,含TATA框和TTGACA共有序列
2、增强子和绝缘子 • 增强子也是一种基因调控序列,它可使启动子发动转录的能力大大增强,从而显著地提高基因转录的效率。 • 增强子的作用与它所处的位置、方向及与基因的距离无关。具有组织特异性和细胞特异性。 • 绝缘子:位于启动子区域的正、负调控元件之间的序列,不影响基因的表达。作用是避免其他调控元件对基因的活化或失活效应。
3、终止子 图示 • 是一段位于基因3’端非翻译区(UTR)中与终止转录过程有关的序列,由一段富含GC的反向重复序列以及寡聚T组成(可以形成茎环结构),是RNA酶停止工作的信号。
4、加尾信号 图示 • 真核生物mRNA的3’Poly(A)尾巴不是由基因编码,是在转录后通过多聚腺苷酸聚合酶作用加上的。此过程受3’UTR中加尾信号的控制。
5、核糖体结合位点 • SD序列(shine-dalgarno sequence): • 在原核生物基因翻译起始位点周围有一组特殊的序列,控制着基因的翻译过程,SD是其中主要的一种。
(三)信号肽序列 图示 • 在分泌蛋白基因的编码序列中,在起始密码子之后,有一段编码富含疏水氨基酸多肽的序列,称为信号肽序列,它所编码的信号肽行使着运输蛋白质的功能。 • 信号肽序列在完成分泌过程后将被切除,不留在新生的多肽链中。
真核生物基因的一般结构示意图 内含子边界3’AG 终止子 5’ UTR 信号肽序列 内含子 终止密码子 5’ m2GpppNp加帽位点 起始密码子 加poly(A)信号 外显子 TATA盒 GC盒 内含子边界5’ GT 3’UTR AGGA或CAAT盒 启动子区域
Key points • Gene structure different regions • Describe the central dogma.