chromosome interaction mapping|cis- and trans-regulation|de novo|SRS|LRS|Haplotype blocks|linkage disequilibrium

Dissecting evolution and disease using comparative vertebrate genomics-The sequencing revolution

 

short-read sequencing (SRS) (因大规模基因组数据需要,采用Illumina paired-end短序列)->genome assembly and long-read sequencing (LRS) 因长序列的需要

 

Sequencing 和assembly两个模块相融合来获得高质量成品(可用来作为参考序列),采用两种测序方法(SRS和LRS)组合bionano(生物纳米技术)组chromosome interaction mapping可获得更多生物学信息。

基因组de novo测序即从头测序,指不需要任何参考基因序列信息即可对某个物种进行测序

chromosome interaction mapping:分析染色体三维组织,以了解染色体的相互作用,因为同一个染色体上的作用为顺式作用;不同染色体之间的作用为反式作用,所以以此明确顺式和反式机制)。

cis- and trans-regulation:顺式和反式作用:相对同一染色体或DNA分子而言为“顺式”(cis);对不同染色体或DNA分子而言为“反式”(trans)

因为参考基因组的出现,可以评估assembly在测序技术在多样化和组合化之后获得的增益,此评估很有价值。

因为人类基因组的获得,我们可以研究在人类基因组上的选择压力。比如,人类疾病基因组和动物基因组。

决定使用哪些附加资源对于去构建新的基因组(即该基因组独特)的研究很关键(这关系到研究的科学性)。比如,群体遗传学需要RNA序列信息(因为该信息对组蛋白标记等特征很有价值)。所以为了研究目标科学性,所以需要考虑好(需要考虑不同层次的数据,DNA,RNA,蛋白质及群体特征等)可行的特征。

Haplotype blocks:杂合不因为重组而因为连锁,其特征是linkage disequilibrium。

linkage disequilibrium:连锁不平衡:如果在研究过的群体中,A和B两个位点上的等位基因不是独立关联的,我们就说这两个位点是连锁不平衡的,即两个基因连锁。

原文地址:https://www.cnblogs.com/yuanjingnan/p/11089141.html

时间: 2024-10-11 08:59:36

chromosome interaction mapping|cis- and trans-regulation|de novo|SRS|LRS|Haplotype blocks|linkage disequilibrium的相关文章

DISCOVAR de novo

海宝建议用这个拼接软件 http://www.broadinstitute.org/software/discovar/blog/?page_id=98 DISCOVAR – variant caller 适合于call variant 和拼接小基因组 DISCOVAR de novo 适合拼接大基因组 下载: ftp://ftp.broadinstitute.org/pub/crd/DiscovarDeNovo/latest_source_code/LATEST_VERSION.tar.gz

混合纠错PBcR--Hybrid error correction and de novo assembly of single-molecule sequencing reads

原文链接:Hybrid error correction and de novo assembly of single-molecule sequencing reads 单分子测序reads(PB)的混合纠错和denovo组装 我们广泛使用的PBcR的原始文章就是这一篇 摘要: PB技术可以产生极长的reads,可以显著提高基因组和转录组的组装. 然而,单分子测序的reads的error rate非常高,这限制了它们在重测序方面的应用. 为了解决这个问题,我们创造了PBcR这个纠错算法和组装策

MCP/解读人:邹婉婷,Precision de novo peptide sequencing using mirror proteases of Ac-LysargiNase and trypsin for large-scale proteomics(基于Ac-LysargiNase和胰蛋白酶的蛋白组镜像de novo测序)

一.概述 由于难以获得100%的蛋白氨基酸序列覆盖率,蛋白组de novo测序成为了蛋白测序的难点,由Ac-LysargiNase(N端蛋白酶)和胰蛋白酶构成的镜像酶组合可以解决这个问题并具有稳定性,这2种消化位点互补的酶能够产生目标蛋白的镜像b,y离子,基于镜像原理设计的算法pNovoM可用于蛋白组de novo测序. 二.研究背景 De novo测序是基于二级质谱谱图解析未知蛋白.翻译后修饰及蛋白突变位点的测序方法,这项技术适用于没有氨基酸序列信息的蛋白及蛋白组解析.De novo测序的难点

The sequence and de novo assembly of the giant panda genome.ppt

sequencing:使用二代测序原因:高通量,短序列 不用长序列原因: 1.算法错误率高 2.长序列测序将嵌合体基因错误积累.嵌合体基因:通过重组由来源与功能不同的基因序列剪接而形成的杂合基因 sequencing: 增多的total length>N>gap>missing in genome The reads with a frequency > 1 were called duplicated reads, and we defined the duplication r

基因组 de novo 组装原理

Falcon软件的组装流程 为了错误校正,将原始子reads进行overlap 预组装和错误校正 错误校正后reads的overlap检测 overlap的过滤 从overlap构建图 从图构建contigs 几个解释: sub-reads是啥?为什么要进行错误校正?校正的原理是什么?length_cutoff和length_cutoff_pre分别是什么意思,为什么要设置这两个参数? sub-reads就是机器出来的reads经过处理后的子reads,方便软件处理: 因为第三代测序是单分子测序

计算机视觉code与软件

Research Code A rational methodology for lossy compression - REWIC is a software-based implementation of a a rational system for progressive transmission which, in absence of a priori knowledge about regions of interest, choose at any truncation time

全基因组重测序基础及高级分析知识汇总

全基因组重测序基础及高级分析知识汇总 oddxix 已关注 2018.09.20 17:04 字数 11355 阅读 212评论 0喜欢 6 转自:http://www.360doc.com/content/18/0208/11/19913717_728563847.shtml 全基因组重测序是通过对已有参考序列(Reference Sequence)的物种的不同个体进行基因组测序,并以此为基础进行个体或群体水平的遗传差异性分析.通过全基因组重测序,研究者可以找到大量的单核苷酸多态性位点(SNP

利用 pacbio 数据组装真菌基因组

最近在做组装稻瘟病的基因组. 估计的基因组大小为40M. 由于没有参考基因组,进行de novo assembly. 用HGAP策略.需要的有用的pacbio数据量应为400M左右, 选用的seed read 最小长度为6K, seed的覆盖度应在20倍左右. 拼接流程为:1,filtering. 2, assembly. 3, mapping. 4, consensus.选用的cutoff如下图: 所有的操作都在网页上进行. piobio 的数据以cell 为单位.每个cell中有很多ZMWS

VCFtools

The C++ executable module examples This page provides usage examples for the executable module. Extended documentation for all of the options can be found on the manual page. Running the program Getting basic file statistics Applying a filter Writing