GATK3.2.2小结(转载)

http://blog.csdn.net/skenoy/article/details/38346489

经过几天的摸索和网上资料的查询对GATK软件有点小心得,现总结如下:

1. fasta文件最好用定位到染色体上的数据,可以不用注释VCF文件(GVF),但如果用VCF文件保证以下几个条件:

1)VCF染色体必须和fasta的染色体数目一致,顺序一致

2)VCF的位点必须从小到大排序

3)VCF的碱基有可能有其他符号,如“~”等,要去除干净

2. 做之前分别使用bwa index,picard中的CreateSequenceDictionary.jar和samtools中的faidx对fasta文件建立索引,且最好在fasta同一个文件夹下面

3. bwa做比对时,最好加入-r参数:"@RG\tID:name\tLB:name\tPL:ILLUMINA\tSM:name",为了以后不再加入头文件

4. picard中ReorderSam.jar是为了矫正你的sam文件的头文件与fasta相一致,如果一致,可以不用做这一步

5. 使用picard处理bwa的paired的sam或bam的任意程序,最好加入VALIDATION_STRINGENCY=LENIENT,因为paired reads有一条比对到染色体的末端时,另外一条picard无法识别就会报错终止运行

6. 如果说合并样本call variant,GATK的多线程有两个,nt代表几个样本使用一个CPU;ncr代表一个样本使用几个CPU

7. GATK 3.0以后不再支持ReduceReads这个程序

最新补充:

8. 有时候reads的cigar值会出问题、或者质量值和碱基对不上、又或者reads出现其他符号,加入下列参数:-filterRNC -filterMBQ -filterNoBases -rf UnmappedRead -rf BadMate -rf DuplicateRead -rf NotPrimaryAlignment -rf MappingQualityUnavailable

现阶段没有做质量值矫正和变异矫正,一是要求数据量比较大,如果小于100M的reads就不要做了;二是目前的商业项目很难做如此麻烦的处理,除了人的项目,因为有相应的很多的注释文件

当然还有其他方法进行矫正,比如跟samtools mpileup的结果相一致的才认为是可靠的

时间: 2024-09-29 08:06:43

GATK3.2.2小结(转载)的相关文章

GATK3.2.2小结

经过几天的摸索和网上资料的查询对GATK软件有点小心得,现总结如下: 1. fasta文件最好用定位到染色体上的数据,可以不用注释VCF文件(GVF),但如果用VCF文件保证以下几个条件: 1)VCF染色体必须和fasta的染色体数目一致,顺序一致 2)VCF的位点必须从小到大排序 3)VCF的碱基有可能有其他符号,如"~"等,要去除干净 2. 做之前分别使用bwa index,picard中的CreateSequenceDictionary.jar和samtools中的faidx对f

博弈论类题目小结——转载

出处http://blog.csdn.net/ACM_cxlove?viewmode=contents    by---cxlove 首先当然要献上一些非常好的学习资料: 基础博弈的小结:http://blog.csdn.net/acm_cxlove/article/details/7854530 经典翻硬币游戏小结:http://blog.csdn.net/acm_cxlove/article/details/7854534 经典的删边游戏小结:http://blog.csdn.net/acm

Spring mvc中@RequestMapping 6个基本用法小结(转载)

小结下spring mvc中的@RequestMapping的用法. 1)最基本的,方法级别上应用,例如: Java代码   @RequestMapping(value="/departments") public String simplePattern(){ System.out.println("simplePattern method was called"); return "someResult"; } 则访问http://local

PLSQL开发笔记和小结(转载)

*****************************************   PLSQL基本结构 ***************************************** 基本数据类型变量      1. 基本数据类型      Number 数字型       Int 整数型       Pls_integer 整数型,产生溢出时出现错误       Binary_integer 整数型,表示带符号的整数       Char 定长字符型,最大255个字符       Va

div样式调整小结 转载

1.多个div使用会自动换行,应该使用float属性  left : 对象浮在左边  right : 对象浮在右边 例如:  float: left  和 float: right 是两个div左右排列在同一行<div style="width: 20%; float: left; height: 100%">图片</div><div style="width: 50%; float: right; height: 100%">图

iOS Storyboard unwind segues使用小结

iOS Storyboard unwind segues使用小结 转载:http://blog.csdn.net/kid_devil/article/details/23218195 使用storyboard开发的时候,经常会在一个scene上添加一个button,再拖拽这个button到某个想要关联的页面,最后选择push的方式跳转.这样scene_A和scene_B就有了一个“顺序”的跳转方式了.但有时,希望可以从scene_B触发某个action,跳转回scene_A.如果还采用刚才的方式

EF 通用数据层类

EF 通用数据层父类方法小结 转载:http://www.cnblogs.com/yq-Hua/p/4165344.html MSSql 数据库 数据层 父类 增删改查: using System; using System.Collections.Generic; using System.Data; using System.Data.Entity; using System.Data.Entity.Infrastructure; using System.Linq; using Syste

[转载] Java集合框架之小结

转载自http://jiangzhengjun.iteye.com/blog/553191 1.Java容器类库的简化图,下面是集合类库更加完备的图.包括抽象类和遗留构件(不包括Queue的实现): 2.ArrayList初始化时不可指定容量,如果以new ArrayList()方式创建时,初始容量为10个:如果以new ArrayList(Collection c)初始化时,容量为c.size()*1.1,即增加10%的容量:当向ArrayList中添加一个元素时,先进行容器的容量调整,如果容

[转载] yonken autoit入门教程小结

对于听说过autoit脚本的朋友,下面的入门教程是个不错的教材,建议大家看看 作者: yonken 据我了解需要编写AutoHotkey/AutoIt脚本来实现自动化操作的用户很多都是网管,其它则可能是一些个人用户,他们一般都具有相当的技术水平,而且都希望能借助脚本来完成某些以往需要人工操作的重复性劳动,但限于语言条件上的限制可能对官方的帮助文档有较难理解之处.为方便读者,我将从最简单的说起,每个示例尽可能同时给出相应的AHK和AU3版本代码.本文将尽可能用较通俗的语言描述,但并不打算讲解语法基