比对记录align bwa bowtie soap

一 BWA安装使用

下载编译BWA
#tar -jxvf bwa-0.5.7.tar.bz2
#make

BWA使用流程
Index the database file in the FASTA format
Find the suffix array (SA) coordinates of good hits of each individual read
Convert SA coordinates to chromosomal coordinate and pair reads

准备资料
Reference genome data (*.fa)
NGS Short reads data (*.fastq)

建立 Index
#bwa index reference.fa

寻找 SA coordinates
#bwa aln reference.fa leftRead.fastq > leftRead.sai
#bwa aln reference.fa rightRead.fastq > rightRead.sai
若是希望使用 multi threads 跑指令的话
#./bwa aln -c -t 3 -f leftreads.sai reference.fa leftreads.fastq
参数说明
* -f file:file to write output to instead of stdout
* -c:input sequences are in the color space
* -t num :number of threads. (初始值:1)

转换 SA coordinates
#bwa sampe reference.fa leftRead.sai rightRead.sai leftRead.fastq rightread.fastq > human.sam
Generate alignments in the SAM format given single-end reads
#./bwa samse -f leftreads.sam reference.fa leftreads.sai leftreads.fastq
#./bwa samse -f rightreads.sam reference.fa rightreads.sai rightreads.fastq
参数说明
* -f file:输出档案
* -n num: Maximum number of alignments to output in the XA tag for reads paired properly.(默认值为:3)

sam结果(bwa比对结果)
每行为一个read的比对结果,分为12字段
1 QNAME Query (pair) NAME
2 FLAG bitwise FLAG
3 RNAME Reference sequence NAME
4 POS 1-based leftmost POSition/coordinate of clipped sequence
5 MAPQ MAPping Quality (Phred-scaled)
6 CIAGR extended CIGAR string
7 MRNM Mate Reference sequence NaMe (‘=’ if same as RNAME)
8 MPOS 1-based Mate POSistion
9 ISIZE Inferred insert SIZE
10 SEQ query SEQuence on the same strand as the reference
11 QUAL query QUALity (ASCII-33 gives the Phred base quality)
12 OPT variable OPTional fields in the format TAG:VTYPE:VALUE
第12字段为比对结果详细记录,分类如下
NM Edit distance
MD Mismatching positions/bases
AS Alignment score
BC Barcode sequence
X0 Number of best hits
X1 Number of suboptimal hits found by BWA
XN Number of ambiguous bases in the referenece
XM Number of mismatches in the alignment
XO Number of gap opens
XG Number of gap extentions
XT Type: Unique/Repeat/N/Mate-sw
XA Alternative hits; format: (chr,pos,CIGAR,NM;)*
XS Suboptimal alignment score
XF Support from forward/reverse alignment
XE Number of supporting seeds

二 Bowtie安装使用

时间: 2024-10-12 23:23:27

比对记录align bwa bowtie soap的相关文章

基于基因组测序数据鉴定单碱基变异的方法总结

单核苷酸多态性,英文single nucleotide polymorphism,缩写为SNP,读音为Snip.SNP主要是指在基因组水平上引起的单个碱基的变异,其在群体中的发生频率不小于1%,包括单碱基的转换.颠换以及单碱基的插入和缺失等. 多态性示意图(图片来源:genome news network) 突变(mutation)和多态性(polymorphism)的主要区别在于: 1)突变在群体中的发生频率小于1%,而多态性的发生频率在大于1%: 2)突变通常对生生物体是有害的,而多态性通常

sam 文件的解释

高通两数据测序之后要map到基因组上,我通常用bwa bowtie和tophat .其实我知道sam 文件有好几个field,每个field代表不同的意思,但是由于各种格式的文件确实太多了,我也记不住每个field具体的意思.每次要用的时候都是上网再去找,或者把相关的资料下载下来,再现学. 今天,我和一个同学讨论我们数据的情况.他们都是用bowtie 去map 的,我之前写了个脚本,是用bwa 做的map,我有点懒散,也懒得再去修改了,于是也没想着要再写一个用bowtie 做map的脚本.与同学

组装三代番木瓜基因组——by Serenity

# 估算测序深度.reads数目.N50等值(自写perl程序): $ perl ~/TangerScript/fqStat -i sunset.raw.subreads.fastq -g 372m 统计结果如下: # 基因组组装三步走1. Correction 2. Assembly 3. Polish  ## Step1: canu组装(1. Correction 2. Assembly) $ (nohup) canu -s spec.txt -p sunset -d sunset-auto

SAM (Sequence Aliginment/Map Format )

用比对软件,如bwa, bowtie, 进行比对后产生的结果,一般为sam 或 bam 格式.bam是sam的二进制文件.下面用实例介绍一下sam文件格式: sam 分为header section (@开头)和 alignment section(一般分为11列), 下图为一个sam文件的前半部分: header 部分以@开头,格式为'TAG:VALUE',  TAG是两个字符: @HD The header line. The first line if present VN Format

比对软件 - 总结

用过的比对软件不多,只知道简单的全局比对和局部比对算法,比对软件的原理基本是不知道的. 现在用过的比对软件: bwa bowtie blasr blast blat 慢慢积累,比较这些软件的不同,因为生物信息最底层的就是比对,测序拿到一堆序列,第一件要做得事情就是比对. 先看一篇好文:Aligner tutorial: GMAP, STAR, BLAT, and BLASR

Extjs定时操作

查看api可知: // 启动一个简单的时钟任务,每秒执行一次更新一个 div var task = { run: function(){ Ext.fly('clock').update(new Date().format('g:i:s A')); }, interval: 1000 //1秒 } Ext.TaskManager.start(task);  1,Extjs如何隔一段时间操作一次 可以看出task是一个 var,通过设置interval隔一段时间操作一次 2,实现的功能效果图: vi

webservice的Axis2入门教程java版

本文转自百度文库 Axis2是一套崭新的WebService引擎,该版本是对Axis1.x重新设计的产物.Axis2不仅支持SOAP1.1和SOAP1.2,还集成了非常流行的REST WebService,同时还支持Spring.JSON等技术.这些都将在后面的系列教程中讲解.在本文中主要介绍了如何使用Axis2开发一个不需要任何配置文件的WebService,并在客户端使用Java和C#调用这个WebService. 一.Axis2的下载和安装 读者可以从如下的网址下载Axis2的最新版本:

Web Service 附件技术的发展及演变

Web Service 通常将业务数据封装在 SOAP 主体或者 SOAP 消息附件中进行传输,这些附件往往采用 Base64 编码二进制方式进行封装,这将大大增加待传输的数据量,消耗比较长的编码时间和传输时间.随着 SOA 以及 Web Service 技术的广泛采用,由于网络带宽,延时的影响以及内存大小的限制,越来越多的应用对 Web Service 附件传输方式以及传输效率提出了更高的要求. 引言 本文对 Web Service 附件技术及其相关开发工具进行了总结,详细介绍了 Web Se

BioConda--转载

1. Conda安装 如BioConda官网[1]所说,BioConda需要Conda安装环境,如果你使用过Anaconda python安装环境,那么你已经有了Conda安装环境,否则,最好的办法是安装Miniconda. 从Miniconda的官网上[2]下载最新版与你使用的系统对应的安装器,例如我使用的是64位Linux系统.Python2.7,那么代码如下: wget  https://repo.continuum.io/miniconda/Miniconda2-latest-Linux