tophat的用法

概述:tophat是以bowtie2为核心的一款比对软件。

tophat工作分两步:

1.将reads用bowtie比对到参考基因组上。

2.将unmapped-reads打断成更小的fragments,比对到参考基因组上,如果比对成功,建立剪切点。

用法:tophat [options]* <index_base> <reads1_1[,…,readsN_1]> [reads1_2,…readsN_2]

<index_base>:参考基因组的index文件的具体目录,例如,index文件存放在当前目录下的index文件夹,文件的名字是hg19.*.*, index数据的文件应该是:./index/hg19,不用写到./index/hg19.*.*。参考基因组应该和index文件放在同一目录中。

reads:PE reads必须放在不同的两个文件中,文件名必须按照*_1, *_2的规范成对出现。如:A.reads1_1.fastq B.reads1_1.fastq A.reads1_2.fastq B.reads1_2fastq

常用options:

-o | --output default: ./tophat_out 输出的文件夹路径。

-r | --mate-inner-dist default: 50 成对的reads之间的平均inner距离。例如:fragments长度300bp,reads长度50bp,则其inner距离为200bp,该值该设为200。

--mate-std-dev default:20 inner距离的标准偏差。

-a | --min-anchor-length default: 8 read的锚定长度:该参数能设定的最小值为3;锚定在junction两边的reads长度只有都大于此值,才能用于junction的验证。
--library-type Tophat处理的reads具有链特异性。比对结果中将会有个XS标签。一般Illumina数据的library-type为 fr-unstranded。

-G | --GTF 提供基因模型的注释文件,GTF 2.2 或者 GFF 3 格式的文件。如果设置了该参数,Tophat 则先提取出转录子序列,然后使用Bowtie2将reads比对到提取的转录组中;只有不能比对上 的reads再比对到genome;比对上的reads再打断转变成genomic mappings;再融合新 的mappings和junctions作为最后的输出。 值得注意的是GTF/GFF文件代表chromosome和contig的第一列要和bowtie index中的 参考序列名一致。


参考文章:http://blog.sina.com.cn/s/blog_8808cae20101amqp.html
				
时间: 2024-11-07 02:36:56

tophat的用法的相关文章

StringTie用法详解

StringTie 参考链接: https://ccb.jhu.edu/software/stringtie/index.shtml?t=manual#input https://www.cnblogs.com/adawong/articles/7977314.html 参数简介 StringTie的基本用法: stringtie <aligned_reads.bam> [options]* 其中,aligned_reads.bam 是输入文件,该输入文件要求必须按其基因组位置排序, HISA

js中获取时间new date()的用法

js中获取时间new date()的用法 获取时间:   var myDate = new Date();//获取系统当前时间 获取特定格式的时间: 1 myDate.getYear(); //获取当前年份(2位) 2 myDate.getFullYear(); //获取完整的年份(4位,1970-????) 3 myDate.getMonth(); //获取当前月份(0-11,0代表1月) 4 myDate.getDate(); //获取当前日(1-31) 5 myDate.getDay();

20.5 Shell脚本中的逻辑判断;20.6 文件目录属性判断;20.7 if特殊用法;20.8 20.9 cace判断(上下)

扩展: select用法 http://www.apelearn.com/bbs/thread-7950-1-1.html 20.5 Shell脚本中的逻辑判断 格式1:if 条件 ; then 语句; fi 1. 创建if1.sh测试脚本: [[email protected] ~]# vi if1.sh a=5,如果a大于3,满足这个条件,显示ok 添加内容: #!/bin/bash a=5 if [ $a -gt 3 ] then echo ok fi 2. 执行if1.sh脚本: [[e

20.1 Shell脚本介绍;20.2 Shell脚本结构和执行;20.3 date命令用法;20.4 Shell脚本中的变量

20.1 Shell脚本介绍 1. shell是一种脚本语言 aming_linux blog.lishiming.net 2. 可以使用逻辑判断.循环等语法 3. 可以自定义函数 4. shell是系统命令的集合 5. shell脚本可以实现自动化运维,能大大增加我们的运维效率 20.2 Shell脚本结构和执行 1. 开头(首行)需要加: #!/bin/bash 2. 以#开头的行作为解释说明: 3. 脚本的名字以.sh结尾,用于区分这是一个shell脚本 4. 执行.sh脚本方法有两种:

shell 中seq的用法 echo -n用法

用法:seq [选项]... 尾数 或:seq [选项]... 首数 尾数 或:seq [选项]... 首数 增量 尾数 从1循环到100的两种方法(bash 其它的shell没试过)for x in `seq 1 100`;do echo $x;donefor x in {1..100};do echo $x;done echo -n 不换行输出 $echo -n "123" $echo "456" 最终输出 123456 echo -e 处理特殊字符 若字符串中

sudo的用法

su -l user -C 'COMMAND' 是用user这个用户执行命令 我们一般使用sudo 这个命令 sudo [-u] user COMMAND sudo [-k] COMMAND 清除此前用户的密码. sudo的配置文件/etc/sudoers 配置项为 users    hosts=(runas)    commands users:可以是一个用户的名称也可以是一个组,也可以是一个别名 username #UID user_alias 用户别名的用法 User_Alias NETA

几招学会 Python 3 中 PyMongo 的用法

本文和大家分享的是Python3下MongoDB的存储操作相关内容,在看本文之前请确保你已经安装好了MongoDB并启动了其服务,另外安装好了Python的PyMongo库.下面进入正题,一起来看看吧,希望对大家学习Python3有所帮助. 连接MongoDB 连接MongoDB我们需要使用PyMongo库里面的MongoClient,一般来说传入MongoDB的IP及端口即可,第一个参数为地址host,第二个参数为端口port,端口如果不传默认是27017. import pymongo cl

11 css中分组选择符的用法

<!doctype html> <html> <head> <meta charset="utf-8"> <title>无标题文档</title> <style type="text/css"> h1,span{color:red;} a:hover{color:#2EE926;} /*分组选择符的用法*/ </style> </head> <body&

gawk 文本处理入门用法详集

awk笔记 gawk - pattern scanning and processing language 报告生成器,可进行格式化输出,文本处理三剑客之一,是基于sed和grep功能的扩展 一般用法格式: awk [options] 'program' FILE...     program: /regular/{print} 语句之间用分号分隔    print,printf 选项: -F:指明输入时用到的字段    -v var=value:指明自定变量 awk运作方式: 逐行读入文本,并