人基因组(一)

人类基因组包含22条染色体和1条X或者Y染色体,这些染色体长度为45~279Mb,加起来共为3286Mb。

基于染色体的结构,全部基因可被分为常染色质(euchromatin)区域(通常包含活性基因)和异质染色质(heterochromatin)区域,后者携带低密度的活性基因。常染色质组成了基因组的主要成分,约为2.9×109bp,已测序的基因组序列覆盖了约90%的常染色质。

实际上只有一小部分人类基因序列(约1%,相当于外显子部分)是用来编码蛋白质的,而内含子则组成了蛋白质基因的其他部分,这样,这些编码蛋白质的基因(外显子加内含子)占基因组总量的约25%。人类基因的平均长度为27kb,平均有9个外显子,而这9个外显子组成总共约1340bp的编码序列,因此编码序列平均占基因长度5%。

两组队人类基因组的相互独立的测序结果分别产生了30000个和40000个基因数目的估计。另人惊奇的结果是,他们分析到的基因只有50%的交叉。早起的根据RNA转录物来分析人类基因组的方法鉴定到了11000个基因,几乎所有这些基因在这两套方法中都存在,占领鉴定到相同基因的绝大多数。

原文地址:https://www.cnblogs.com/daimakun/p/10068506.html

时间: 2024-10-17 06:18:28

人基因组(一)的相关文章

利用千人基因组数据库查看SNP在不同地区、国家、洲的频率及个数

首先,进入千人基因组数据库的网站:https://www.ncbi.nlm.nih.gov/variation/tools/1000genomes/ 如下图所示,在数据库的框框里输入我们感兴趣的SNP,比如rs608139 搜索后出现如下界面,黄色区域是我们感兴趣的SNP,红色框框是不同国家和地区在该SNP对应的频率和个数. 千人基因组数据库包括的国家和地区如下表所示. 国家 Continent Population (Abb) 中国,北京 Asian CHB 日本,东京 Asian JPT 中

全基因组重测序基础及高级分析知识汇总

全基因组重测序基础及高级分析知识汇总 oddxix 已关注 2018.09.20 17:04 字数 11355 阅读 212评论 0喜欢 6 转自:http://www.360doc.com/content/18/0208/11/19913717_728563847.shtml 全基因组重测序是通过对已有参考序列(Reference Sequence)的物种的不同个体进行基因组测序,并以此为基础进行个体或群体水平的遗传差异性分析.通过全基因组重测序,研究者可以找到大量的单核苷酸多态性位点(SNP

《三联生活周刊》2017年23期:5星。地球年龄与人类进化的检测技术的简史。

本期主题是人类测量地球年龄与人类进化史的技术的简史.地球年龄最终依靠同位素测量法确定为45.5亿年,人类进化史初期是根据化石推测,后来则根据DNA的变化来推算. 个人感觉这是看过的袁岳的文章中最精彩的一篇,有靠谱的技术发展史,故事也比较有意思.袁岳是理科生风格,严肃有余,讲故事的天赋则相对不足.当然反过来说讲故事天赋比较好的人,一般来说写出来的东西可靠性稍差. 以下是书中内容的摘抄,大部分是主题文章的摘抄.#号后面是kindle电子书中的页码: 1:再后来,他采用了一种从铀铅测年法推导出来的铅铅

BWA/BWT 比对软件

名称    bwa –   Burrows-Wheeler  Alignment Tool 内容摘要描述命令行与选项SAM 比对格式短序列比对注意事项  比对精确性  估计插入大小分布  内存需求  速度Bwa-0.6中的改变其他作者引用与授权历史 摘要 b w a   i n d e x   r e f . f ab w a   m e m   r e f . f a   r e a d s . f q   >   a l n - s e . s a mb w a   m e m   r e

【转】GATK使用方法详解(包含bwa使用)

一.使用GATK前须知事项: (1)对GATK的测试主要使用的是人类全基因组和外显子组的测序数据,而且全部是基于illumina数据格式,目前还没有提供其他格式文件(如Ion Torrent)或者实验设计(RNA-Seq)的分析方法. (2)GATK是一个应用于前沿科学研究的软件,不断在更新和修正,因此,在使用GATK进行变异检测时,最好是下载最新的版本,目前的版本是2.8.1(2014-02-25).下载网站:http://www.broadinstitute.org/gatk/downloa

阿里云MaxCompute被Forrester评为全球云端数据仓库领导者

摘要: 参考消息网3月19日报道 日前,全球权威调研机构佛瑞斯特研究公司(Forrester)发布<2018年一季度云端数据仓库>报告.报告对大数据服务商的主要功能.区域表现.细分市场和典型客户等进行了全面评估,最终AWS.阿里云.谷歌.微软四大巨头杀入全球一线阵营. 参考消息网3月19日报道 日前,全球权威调研机构佛瑞斯特研究公司(Forrester)发布<2018年一季度云端数据仓库>报告.报告对大数据服务商的主要功能.区域表现.细分市场和典型客户等进行了全面评估,最终AWS.

生物信息学题目整理: 陈润生

生物信息学题目整理: 陈润生: 一.什么是生物信息学?你怎么理解它的含义? Genome informatics is a scientific discipline that encompasses all aspects of genome information acquisition, processing, storage, distribution, analysis, and interpretation. 1.生物信息学是一个学科领域,包含着基因组信息的获取.处理.存储.分配 .

中科院生物信息学题目整理

1.什么是生物信息学,如何理解其含义? 答:生物信息学有三个方面的含义: 1)         生物信息学是一个学科领域,包含着基因组信息的获取.处理.存储.分配 .分析和解释的所有方面. 2)         生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质:同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测:其本质是识别基因信号. 3)         生物信息学的研究目标是揭示"基因组信息结构的复杂性及遗传语言的根本规律"

测序总结,高通量测序名词

主要来自 :http://mp.weixin.qq.com/s/iTnsYajtHsbieGILGpUYgQ 测序的黄金标准:一代测序了,故称之为黄金测序. 高通量测序最近这几年很火越来越火,但是世界上更多的还是一帮天天做分子克隆.养细胞.养细菌.杂蛋白的生物学家,究其原因Sanger测序还是测序届的金标准,由于精确度高于2.3代测序且保持大白菜价格使之地位稳固. 应用范围:De Novo测序.重测序: 如突变检测.SNPs.插入.缺失克隆产物验证.比较基因组.分型: 如微生物和真菌鉴定.HLA