理解soft-clipped reads

什么是soft-clipped reads

当基因组发生某一段的缺失,或转录组的剪接,在测序过程中,横跨缺失位点及剪接位点的reads回帖到基因组时,一条reads被切成两段,匹配到不同的区域,这样的reads叫做soft-clipped reads,这些reads对于鉴定染色体结构变异及外源序列整合具有重要作用。

什么是multi-hits reads

由于大部分测序得到的reads较短,一个reads能够匹配到基因组多个位置,无法区分其真实来源的位置。一些工具根据统计模型,如将这类reads分配给reads较多的区域。

时间: 2024-09-29 16:41:48

理解soft-clipped reads的相关文章

bowtie2用法

bowtie2的功能:短序列的比对 用法:bowtie2 [options]* -x <bt2-idx> {-1 <m1> -2 <m2> | -U <r>} [-S <sam>] -x <bt2-idx>:参考基因组的索引路径 {-1 <m1> -2 <m2> | -U <r>}:比对的reads路径.-1,-2是针对PE reads:-U是针对SE reads(unpaired) [-S <

&lt;转&gt;shell经典,shell十三问

shell 十三问: 1) 为何叫做 shell ? 2) shell prompt(PS1) 与 Carriage Return(CR) 的关系? 3) 别人 echo.你也 echo ,是问 echo 知多少? 4) " "(双引号) 与 ' '(单引号)差在哪? 5) var=value?export 前后差在哪? 6) exec 跟 source 差在哪? 7) ( ) 与 { } 差在哪? 8) $(( )) 与 $( ) 还有${ } 差在哪? 9) [email prot

shell十三问(转)

这个我记得是在chinaunix论坛上最早出现的帖子. Shell 十三问 作者:www.chinaunix.net之網中人 1) 为何叫做 shell ? 在介绍 shell 是甚么东西之前,不妨让我们重新检视使用者与计算机系统的关系: 我们知道计算机的运作不能离开硬件,但使用者却无法直接对硬件作驱动, 硬件的驱动只能透过一个称为"操作系统(Operating System)"的软件来控管, 事实上,我们每天所谈的 linux ,严格来说只是一个操作系统,我们称之为"核心(

linux shell中的单引号与双引号的区别(看完就不会有引号的疑问了)(转)

" "(双引号)与 ' '(单引号)的区别  你在shell prompt后面敲打键盘.直到按下enter的时候,你输入的文字就是command line了,然后shell才会以进程方式执行你所提交的命令.但是,你又可知道:你在command line输入的每一个文字,对shell来说,有什么类别之分呢? 简单而言,command line的每一个charactor分为如下两种:   *literal:也就是普通纯文字,对shell来说没有特殊功能.   *meta:对shell来说,

置顶十三问

1     简介... 3 2     为何叫做 shell ?... 3 3     shell prompt(PS1) 与 Carriage Return(CR) 的关系?... 4 4     别人 echo.你也 echo ,是问 echo 知多少?... 5 5     " "(双引号) 与 ' '(单引号)差在哪?... 7 6     var=value?export 前后差在哪?... 11 7     exec 跟 source 差在哪?... 16 8     (

Shell 十三问[转]

shell 十三问:1) 为何叫做 shell ? 2) shell prompt(PS1) 与 Carriage Return(CR) 的关系? 3) 别人 echo.你也 echo ,是问 echo 知多少? 4) " "(双引号) 与 ' '(单引号)差在哪?  5) var=value?export 前后差在哪?6) exec 跟 source 差在哪? 7) ( ) 与 { } 差在哪?8) $(( )) 与 $( ) 还有${ } 差在哪? 9) [email protec

【林轩田】SVM

SVM 推导 点到平面的距离(几何距离): 函数距离: |wx+b|,不考虑1/||w||. SVM的优化目标:所有样本点到分离超平面的最小的几何距离最大,可以写成: 这里 限制条件的第一行表示每个样本点都被正确的分类, 第二行表示最大化的目标是样本点到分离超平面的最小几何距离. W,b同步放缩并不影响分离超平面,故放缩至一定比例,使所有样本点到超平面的最小函数距离刚好为1, 那么最大化的目标就很简单了 需要优化的问题的形式为: 注意,既然放缩时使最小的函数间隔为1,那么实际上产生了一个比之前每

对Inode、Hard Link以及Soft Link的理解

一.EXT2/EXT3等文件系统的分区格式 Linux的文件系统从EXT2开始将文件的属性和文件的实际内容分开存储,文件的属性由inode存储,文件的内容由block存储. 系统在对磁盘进行分区格式化的时候,分区被以block大小为单位分割成多个块,block的大小可以为1KB.2KB或4KB:分区里的各个块被统一编号,然后被划分成各个区域,图1描述了一个分区的划分情况: 图1 分区划分情况 各区域解释: Boot Sector:启动扇区,利用这个多个分区的启动扇区可以实现多系统. Block

Difference between Hard Clip(H) and Soft Clip(S) in Samtools CIGAR string

一般人都知道 H 和 S 的表面上的区别,即 S 就是 soft, H 就是 hard,S 后,序列里还是会保留序列的信息,而 H 则不会. 但这只是表面上的,在深层次的意义上, H 和 S 又有什么本质的不同呢? 首先要了解嵌合体的概念: 嵌合体就是两个不同的序列错误的拼接到了一起,也就是一条序列分别比对到了 ref 的两个地方(这和多重比对.次级比对之间又有区别) Example of extended CIGAR and the pileup output. (a) Alignments