遗传密码

https://zh.wikipedia.org/wiki/%E9%81%97%E4%BC%A0%E5%AF%86%E7%A0%81

遗传密码(英文:Genetic code)是一组规则,将DNAmRNA序列以三个核苷酸为一组的密码子转译蛋白质氨基酸序列,以用于蛋白质合成。几乎所有的生物都使用同样的遗传密码,称为标准遗传密码;即使是非细胞结构的病毒,它们也是使用标准遗传密码。但是也有少数生物使用一些稍微不同的遗传密码。

目录

[隐藏]

破解历史

自从发现了DNA的结构,科学家便开始致力研究有关制造蛋白质的秘密。伽莫夫指出需要以三个核酸一组才能为20个氨基酸编码。1961年,美国国家卫生院J. Heinrich Matthaei马歇尔·沃伦·尼伦伯格无细胞系统环境下,把一条只由尿嘧啶(U)组成的RNA转释成一条只有苯丙氨酸(Phe)的多肽,由此破解了首个密码子(UUU -> Phe)。随后哈尔·葛宾·科拉纳破解了其它密码子,接着罗伯特·W·霍利发现了负责转录过程的tRNA。1968年,科拉纳、霍利和尼伦伯格分享了诺贝尔生理学或医学奖。 但朊病毒是以蛋白质为遗传密码的。???

基因组的表达

一个生物体携带的遗传信息-即基因组-被记录在DNA或RNA分子中,分子中每个有功能的单位被称作基因。每个基因均是由一连串单核苷酸组成。每个单核苷酸均由碱基戊糖(即五碳糖,DNA中为去氧核糖,RNA中为核糖)和磷酸三部分组成。堿基不同构成了不同的单核苷酸。组成DNA的堿基有腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)及胸腺嘧啶(T)。组成RNA的堿基以尿嘧啶(U)代替了胸腺嘧啶(T)。三个单核苷酸形成一组密码子,而每个密码子代表一个氨基酸或停止讯号。

制造蛋白质的过程中,基因先被从DNA转录为对应的RNA范本,即信使RNA(mRNA)。接下来在核糖体转移RNA(tRNA)以及一些的作用下,由该RNA范本转译成为氨基酸组成的链(多肽),然后经过转译后修饰形成蛋白质。详情参阅转译

因为密码子由三个核苷酸组成,故一共有43=64种密码子。例如,RNA序列UAGCAAUCC包含了三个密码子:UAG,CAA和UCC。这段RNA编码了代表了长度为3个氨基酸的一段蛋白质序列。(DNA也有类似的序列,但是以T代替了U)。

标准遗传密码如下表所示:由3个堿基对应到氨基酸的密码子表以及由氨基酸对应到3个堿基的反密码子表。

表一:密码子表[编辑]

此表列出了64种密码子以及氨基酸的标准配对。
  第二位碱基
U C A G




U UUU (Phe/F)苯丙氨酸

UUC (Phe/F)苯丙氨酸
UUA (Leu/L)亮氨酸
UUG (Leu/L)亮氨酸

UCU (Ser/S)丝氨酸

UCC (Ser/S)丝氨酸
UCA (Ser/S)丝氨酸
UCG (Ser/S)丝氨酸

UAU (Tyr/Y)酪氨酸

UAC (Tyr/Y)酪氨酸
UAA 终止
UAG 终止

UGU (Cys/C)半胱氨酸

UGC (Cys/C)半胱氨酸
UGA 终止
UGG (Trp/W)色氨酸

C CUU (Leu/L)亮氨酸

CUC (Leu/L)亮氨酸
CUA (Leu/L)亮氨酸
CUG (Leu/L)亮氨酸

CCU (Pro/P)脯氨酸

CCC (Pro/P)脯氨酸
CCA (Pro/P)脯氨酸
CCG (Pro/P)脯氨酸

CAU (His/H)组氨酸

CAC (His/H)组氨酸
CAA (Gln/Q)谷氨酰胺
CAG (Gln/Q)谷氨酰胺

CGU (Arg/R)精氨酸

CGC (Arg/R)精氨酸
CGA (Arg/R)精氨酸
CGG (Arg/R)精氨酸

A AUU (Ile/I)异亮氨酸

AUC (Ile/I)异亮氨酸
AUA (Ile/I)异亮氨酸
AUG (Met/M)甲硫氨酸起始1

ACU (Thr/T)苏氨酸

ACC (Thr/T)苏氨酸
ACA (Thr/T)苏氨酸
ACG (Thr/T)苏氨酸

AAU (Asn/N)天冬酰胺

AAC (Asn/N)天冬酰胺
AAA (Lys/K)赖氨酸
AAG (Lys/K)赖氨酸

AGU (Ser/S)丝氨酸

AGC (Ser/S)丝氨酸
AGA (Arg/R)精氨酸
AGG (Arg/R)精氨酸

G GUU (Val/V)缬氨酸

GUC (Val/V)缬氨酸
GUA (Val/V)缬氨酸
GUG (Val/V)缬氨酸

GCU (Ala/A)丙氨酸

GCC (Ala/A)丙氨酸
GCA (Ala/A)丙氨酸
GCG (Ala/A)丙氨酸

GAU (Asp/D)天冬氨酸

GAC (Asp/D)天冬氨酸
GAA (Glu/E)谷氨酸
GAG (Glu/E)谷氨酸

GGU (Gly/G)甘氨酸

GGC (Gly/G)甘氨酸
GGA (Gly/G)甘氨酸
GGG (Gly/G)甘氨酸

1标准起始编码,同时为甲硫氨酸编码。mRNA中以某一个AUG作为蛋白质翻译的起始部位。但最终成熟蛋白质中由于翻译后修饰作用,不一定均会以甲硫氨酸作为第一个氨基酸残基

表二:逆密码子表

此表列出了和20种氨基酸和密码子的标准配对(嘌呤族(缩写作R)嘧啶族(Y)任意碱基(N))。

Ala A GCN Leu L UUR, CUN
Arg R CGN, AGR Lys K AAR
Asn N AAY Met M AUG
Asp D GAY Phe F UUY
Cys C UGY Pro P CCN
Gln Q CAR Ser S UCN, AGY
Glu E GAR Thr T ACN
Gly G GGN Trp W UGG
His H CAY Tyr Y UAY
Ile I AUY, AUA Val V GUN
起始 AUG 终止 UAR, UGA

技术细节

起始和终止密码子

蛋白质的转译从初始化密码子(起始密码子)开始,但亦需要适当的初始化序列和起始因数才能使mRNA和核糖体结合。最常见的起始密码子为AUG,其同时编码的氨基酸在细菌为甲酰甲硫氨酸,在真核生物为甲硫氨酸,但在个别情况其它一些密码子也具有起始的功能。

在经典遗传学中,终止密码子各有名称:UAG为琥珀(amber),UGA为蛋白石(opal),UAA为赭石(ochre)。这些名称来源于最初发现到这些终止密码子的基因的名称。终止密码子使核糖体和释放因数结合,使多肽核糖体分离而结束转译的程式。另外,在哺乳动物的线粒体中,AGA和AGG也充当终止密码子。

简并性

大部分密码子具有简并性,即两个或者多个密码子编码同一氨基酸。简并的密码子通常只有第三位元堿基不同,例如,GAA和GAG都编码谷氨酰胺。如果不管密码子的第三位元为哪种核苷酸,都编码同一种氨基酸,则称之为四重简并;如果第三位有四种可能的核苷酸之中的两种,而且编码同一种氨基酸,则称之为二重简并,一般第三位上两种等价的核苷酸同为嘌呤(A/G)或者嘧啶(C/T)。只有两种氨基酸仅由一个密码子编码,一个是甲硫氨酸,由AUG编码,同时也是起始密码子;另一个是色氨酸,由UGG编码。

遗传密码的这些性质可使基因更加耐受点突变。例如,四重简并密码子可以容忍密码子第三位元的任何变异;二重简并密码子使三分之一可能的第三位的变异不影响蛋白质序列。由于转换变异(嘌呤变为嘌呤或者嘧啶变为嘧啶)比颠换变异(嘌呤变为嘧啶或者嘧啶变为嘌呤)的可能性更大,因此二重简并密码子也具有很强的对抗突变的能力。不影响氨基酸序列的突变称为沉默突变

简并性的出现是由于tRNA反密码子的第一位堿基可以和mRNA构成摆动堿基对,常见的情况为反密码子上的次黄嘌呤(I),以及和密码子形成非标准的U-G配对。

另一种有助对抗点突变的情况,是NUN(N代表任何核苷酸)倾向于代表疏水性氨基酸,故此即使出现突变,仍有较大机会维持蛋白质的亲水度,减低致命破坏的可能。

阅读框

“密码子”是由阅读的起始位点决定的。例如,一段序列GGGAAACCC,如果由第一个位置开始读,包括3个密码子GGG,AAA和CCC。如果从第二位开始读,包括GGA和AAC(忽略不完整的密码子)。如果从第三位开始读,则为GAA和ACC。故此每段序列都可以分为三个阅读框,每个都能产生不同的氨基酸序列(在上例中,相应为Gly-Lys-Pro,Gly-Asp,和Glu-Thr)。而因为DNA的双螺旋结构,每段DNA实际上有六个阅读框。 实际的框架是由起始密码子确定,通常是mRNA序列上第一个出现的AUG。

破坏阅读框架的变异(例如,插入或删除1个或2个核苷酸)称为阅读框变异,通常会严重影响到蛋白质的功能,故此并不常见,因为他们通常不能在演化中存活下来。

非标准的遗传密码

虽然遗传密码在不同生命之间有很强的一致性,但亦存在非标准的遗传密码。在有“细胞能量工厂”之称的线粒体中,便有和标准遗传密码数个相异的之处,甚至不同生物的线粒体有不同的遗传密码。支原体会把UGA转译为色氨酸。纤毛虫则把UAG(有时候还有UAA)转译为谷氨酰胺(一些绿藻也有同样现象),或把UGA转译为半胱氨酸。一些酵母会把GUG转译为丝氨酸。在一些罕见情况,一些蛋白质会有AUG以外的起始密码子。

真菌、原生生物和人以及其它动物的粒线体中的遗传密码与标准遗传密码的差异,主要变化如下:

密码子 通常的作用 例外的作用 所属的生物
UGA 中止编码 色氨酸编码 人、牛、酵母线粒体,支原体(Mycoplasma)基因组,如Capricolum
UGA 中止编码 半胱氨酸编码 一些纤毛虫(ciliate)细胞核基因组,如游纤虫属(Euplotes)
UGA 中止编码 硒半胱氨酸编码 人,大鼠,小鼠等哺乳体系
AGR 精氨酸编码 中止编码 大部分动物线粒体,脊椎动物线粒体
AGA 精氨酸编码 丝氨酸编码 果蝇线粒体
AUA 异亮氨酸编码 蛋氨酸编码 一些动物和酵母线粒体
UAA 中止编码 谷氨酰胺编码 草履虫、一些纤毛虫(ciliate)细胞核基因组,如嗜热四膜虫(ThermophAilus tetrahymena
UAG 中止编码 谷氨酸编码 草履虫核细胞核基因组
UAG 中止编码 吡咯赖氨酸编码 甲烷八叠球菌(Methanosarcina barkeri)核基因组,表达转甲基酶(methyltransferase)
GUG 缬氨酸编码 丝氨酸编码 假丝酵母核基因组
AAA 赖氨酸编码 天冬氨酸编码 一些动物的线粒体,果蝇线粒体
CUG 亮氨酸编码 中止编码 圆柱念珠菌(Candida cylindracea)细胞核基因组
CUN 亮氨酸编码 苏氨酸编码 酵母线粒体

按信使RNA的序列,在一些蛋白质里停止密码子会被翻译成非标准的氨基酸,例如UGA转译为硒半胱氨酸和UAG转译为吡咯赖氨酸,随着对基因组序列加深了解,科学家可能还会发现其它非标准的转译方式,以及其它未知氨基酸在生物中的应用。

遗传密码的起源[编辑]

除了少数的不同之外,地球上已知生物的遗传密码均非常接近;因此根据进化论,遗传密码应在生命历史中很早期就出现。现有的证据表明遗传密码的设定并非是随机的结果,对此有以下的可能解释1:

  • 最近一项研究显示,一些氨基酸与它们相对应的密码子有选择性的化学结合力2,这显示现在复杂的蛋白质制造过程可能并非一早存在,最初的蛋白质可能是直接在核酸上形成。
  • 原始的遗传密码可能比今天简单得多,随着生命演化制造出新的氨基酸再被利用而令遗传密码变得复杂。虽然不少证据证明这观点3,但详细的演化过程仍在探索之中4,5
时间: 2024-10-09 09:24:00

遗传密码的相关文章

扩展生命遗传密码

2014年5月12日一期的<Science>上发表了一片关于合成生物学的文章,非常的有意义. 我们都知道,地球上已知的所有生物的遗传信息都是由两组遗传密码构成:A-T.G-C.但是,加州大学的研究者们人工合成了第三对遗传密码--X-Y(暂称).这为合成生物学开启了一扇新的大门,使得在理论上,利用微生物合成多达172中氨基酸成为可能.这将为药物以及新材料的研发提供新的机遇.同时,这也有利于我们探索一些生物领域的根本问题:DNA是如何进化的?为什么自然条件下的所有生物共用一套遗传密码?    我们

遗传密码的奥秘

请看下图: 传统描述生物学很有趣,而现代分子生物学则很复杂.上图是遗传密码的示意图. 1953年,美国Watson发现遗传基因(DNA)的双螺旋结构,为此,Watson在1962年荣获诺贝尔生理学大奖.随后,不少人跟进研究,DNA怎么承载遗传信息,其中的奥秘究竟是什么? 经过无数次的实验与探索,遗传密码的奥秘直到1968年才算最后搞定,有相关诺贝尔生理学奖为证.实际上,地球上的一切生物都有遗传物质,表现在该生物体的细胞核中的"非周期性晶体"(即线性DNA结构),就像一条很长很长的字符串

基因测序

英美科学家18日公布了人类第一号染色体的基因测序图,这个染色体是人类"生命之书"中最长也是最后被破解的一章. 据英国<自然>杂志网络版报道,第一号染色体中共有2.23亿个碱基对,占人类基因组中碱基对总量的8%左右.碱基对是组成生物遗传物质的基本单位. 科学家这次测序确定了人类第一号染色体中的3141个基因,这些基因中存在的缺陷与350种疾病有关,其中包括癌症.帕金森病.早老性痴呆等. 人类有22对非性染色体,最大的是第一号染色体,最小的是第22号染色体.另外还有性染色体决定

读《三体三部》笔记

2015-2-5 15:09 小公司不能露面,不能猖狂,因为他没有能力,完善发展的大公司是谦逊,保密,有战略有计划地悄悄发展,因为他知道了黑暗森林法则,知道了如何才能更好地生存.那些刚发展一点就露面猖狂的公司,打的就是他. CEO就要像面壁者一样,因为你有很大的资源可以统配,你能够做统划全局的事情,而且你还是直接的责任负责人,公司的盈亏直接对你的影响你的利益,对于员工,只要想办法让他们好好工作,找到自己的乐趣和价值,就好了,没必要让他们明白计划,也没必要让他们绝对民主.当然,如果能让有能力的某些

志愿计算框架与论坛

志愿计算,是一种利用计算机闲置资源参与公益类分布式计算的方法. 志愿计算的框架: 1 [email protected] [email protected]是一个研究蛋白质折叠,误折,聚合及由此引起的相关疾病的分布式计算工程.蛋白质是一个生物体系的网络基础,它们是一个个纳米级计算机.在蛋白质实现它的生物功能之前,它们会把自己装配起来,或者说是折叠:折叠过程对人类而言仍是未解之谜.当蛋白质没有正确折叠(误折)无疑会产生严重的后果,包括许多知名的疾病,比方阿兹海默症(Alzheimer's),疯牛病

【数论Day3】进制问题 题目

20170602-1数论_进制 题解:http://www.cnblogs.com/ljc20020730/p/6935240.html 日期 序号 题目名称 输入文件名 输出文件名 时限 内存 算法 难度 081015 1 K进制数 kbased.in kbased.out 1s 256MB 数学分析 1 121028 2 C and.in and.out 1s 128M 数论 2 091110 3 甲型流感 H1N1.IN H1N1.OUT 1s 256MB 快速幂 2 081022 4 数

[BZOJ 3145][Feyat cup 1.5]Str 解题报告

[Feyat cup 1.5]Str DescriptionArcueid,白姬,真祖的公主.在和推倒贵看电影时突然对一个问题产生了兴趣:我们都知道真祖和死徒是有类似的地方.那么从现代科学的角度如何解释呢?自然就得研究遗传密码了.Arcueid得知了两者的DNA片段,想寻求一个DNA片段,使得其在两者的DNA中都出现过.我们知道公主的脑袋有点不太灵活,如果两个DNA片段只有一个位置不同,她也会将其认为是相同的.所以请您找出这样的最长的DNA片段吧.Input两行,每行一个字符串.Output一个

氨基酸

https://zh.wikipedia.org/zh/%E6%B0%A8%E5%9F%BA%E9%85%B8 氨基酸(英文:Amino acid)是生物學上重要的有機化合物,它是由胺(-NH2)和羧酸(-COOH)的官能團組成的,以及一個側鏈连到每一個氨基酸.氨基酸是構成蛋白質的基本單位,賦予蛋白質特定的分子結構形態,使他的分子具有生化活性.蛋白質是生物体內重要的活性分子,包括催化新陳代謝的酶(又称“酵素”). 不同的氨基酸脱水缩合形成肽(蛋白質的原始片段),是蛋白質生成的前體. 目录 1 基

高中生物结论性语句111条

第一章 生命的基本单位--细胞 1.生物体具有共同的物质基础和结构基础. 2.细胞是生物体的结构和功能的基本单位:细胞是一切动植物结构的基本单位.病毒没有细胞结构. 3.新陈代谢是生物体进行一切生命活动的基础. 4.生物体具应激性,因而能适应周围环境. 5.生物遗传和变异的特征,使各物种既能基本上保持稳定,又能不断地进化. 6.生物体都能适应一定的环境,也能影响环境. 7.组成生物体的化学元素,在无机自然界都可以找到,没有一种化学元素是生物界所 特有的,这个事实说明生物界和非生物界具统一性. 8