转录本(transcript)长度范围 3214482 到3671498
3214482--3216021----3216022--3216024----3216025--3216968----3421702--3421901----3670552--3671348----3671346--3671348----3671349--3671498
3UTR stop_codon CDS3 | | CDS2 | | CDS1 start_codon 5UTR
| | | |
3214482------------------------------------------------------------3216968----3421702--3421901----3670552-----------------------------------------------------------3671498
exon3(3UTR,stop_codon, CDS3) exon3(CDS2) exon1(5UTR,stop_codon, CDS1)
解释 transcript、UTR、stop_codon、exon、CDS、start_codon关系
CDS,是编码一段蛋白产物的序列。cds必定是一个orf。但也可能包括很多orf。反之,每个orf不一定都是cds。
开放阅读框(ORF)是基因序列的一部分,有内含子的,且包含一段可以编码蛋白的碱基序列。由于拥有特殊的起始密码子和直到可以从该段碱基序列产生合适大小蛋白才出现的终止密码子,该段碱基序列编码一个蛋白。OEF排除内含子就是CDS