tophat-fusion 鉴定融合基因

tophat-fusion 是一款利用RNA_seq 数据鉴定融合基因的工具,官网链接如下:

http://ccb.jhu.edu/software/tophat/fusion_index.shtml

安装:

tophat-fusion 是集成在tophat软件中的,具体的安装参考tophat的安装就好了

使用方法:

对于tophat-fusion 而言,要求固定的目录结构,比如我在result 文件夹下进行tophat-fusion的分析

那么我需要在该目录下准备几个文件:

1)物种对应的refGene.txt 和 ensGene.txt (这两个文件可以从UCSC下载得到)

2)  新建一个blast 文件夹,注意文件夹的名字必须为"blast", 在blast 文件夹下需要从NCBI下载 nt. human_genomic. other_genomic 开头的所有文件

下载的链接如下:

3)  tophat_fusion 的输出目录: 每个样本一个输出目录,输出目录的前缀为tophat_, 下划线之后加上样本名称,类似 tophat_MCF7;

当然你还需要物种对应的bowtie1 的索引文件,注意这里必须为bowtie1的索引,tophat 检测融合基因时推荐bowtie1的索引方式

上述文件都准备好之后,就可以开始分析了;

第一步:toohat 比对,和普通的比对类似,只不过为了融合基因的检测,需要添加几个额外的参数:

tophat2 -o tophat_MCF7 -p 20  --fusion-search --keep-fasta-order  --bowtie1 --no-coverage-search -r 0 --mate-std-dev 80 --max-intron-length 100000 --fusion-min-dist 100000 --fusion-anchor-length 13 --fusion-ignore-chromosomes chrM hg19_bowtie1/hg19  SRR064286_1.fastq SRR064286_2.fastq

第二步:tophat-fusion-post , 生成融合基因的结果

tophat-fusion-post -p 20 --num-fusion-reads 1 --num-fusion-pairs 2 --num-fusion-both 5 hg19_bowtie1/hg19

需要指出的是,tophat-fusion-post 根据固定的目录结构进行样本,如果有多个样本,每个样本单独进行tophat 比对,只要输出目录区分开即可,比如A,B,C 3个样本,就有3个输出文件夹

tophat_A, tophat_B, tophat_C

运行完成之后,会生成一个名为 tophatfusion_out 的文件夹,该文件夹下是所有样本的融合基因分析的结果:

1)result.hml : 所有样本的融合基因分析的结果,直接看这个html

如上所示。在result.html 中,首先给出预测得到的融合基因,以表格形式进行展示,每列的含义如下:

1. Sample name in which a fusion is identified

2. Gene on the "left" side of the fusion

3. Chromosome ID on the left

4. Coordinates on the left

5. Gene on the "right" side

6. Chromosome ID on the right

7. Coordinates on the right

8. Number of spanning reads - this is the number of reads that span a
fusion point all on their own. In other words, the read itself has a
fusion break point within it.

9. Number of spanning mate pairs - this is the number of pairs of reads
where one read maps entirely on the left and the other read maps
entirely on the right of the fusion break point. Neither read is split,
so these pairs are not counted at all in (8).

10. Number of spanning mate pairs where one end spans a fusion (reads spanning fusion with only a few bases are included).

If you follow the the 9th column, it shows coordinates "number1:number2"
where one end is located at a distance of "number1" bases from the left
genomic coordinate of a fusion and "number2" is similarly defined.

时间: 2024-09-19 06:03:50

tophat-fusion 鉴定融合基因的相关文章

一文搞懂基因融合(gene fusion)的定义、产生机制及鉴定方法

欢迎关注微信公众号:AIPuFuBio和使用生物信息学平台AIPuFu:www.aipufu.com. [基因融合的定义] 基因融合(gene fusion)是指由于某种机制(如基因组变异)使得两个不同基因的部分序列或全部序列融合到一起,形成了一个新的基因.如下图所示: 基因融合示意图(图片来源:https://www.tumorfusions.org/) 一般来说,基因融合是指基因组层面的融合.但转录组层面也可能发生融合,主要是由于两个不同基因转录产生的RNA,由于某种原因融合在了一起,形成新

FusionCancer-人类癌症相关的融合基因的数据库

RNA-seq 测序可以用于融合基因的发现,在过去的十几年里,RNA-seq 测序数据不断增加,发现的融合基因的数据也不断增加: FusionCancer 是一个人类癌症相关的融合基因的数据库,利用NCBI SRA数据库中的RNA-seq 数据,采用tophat-fusion, soap-fusion, fusionmap, chimerascan 4款预测融合基因的软件进行预测: 网址如下: http://donglab.ecnu.edu.cn/databases/FusionCancer/

VMware Fusion下Centos联网

1.VMware Fusion设置选择"网络适配器" 2."连接我的网络适配器"选择"与我的mac共享" 3.编辑centos的ip配置文件 [[email protected] ~]# more /etc/sysconfig/network-scripts/ifcfg-eth0 DEVICE=eth0 TYPE=Ethernet UUID=135a7471-b220-4c9b-ad21-f740e2a5b196 ONBOOT=yes NM_CO

Mac系统下虚拟机VMware Fusion下Win10如何通过Navcat连接Mysql 5.7

最近一直在折腾Mac系统,原先对Mac使用也不是很熟悉,所以安装过程中出现了很多问题.为了以后查阅方便,当然也为了使得和我一样的小白少踩一些坑, 所以就记录一下这些问题. 首先说一下VMware Fusion这个虚拟机软件吧.我下载的官方最新的版本8.5.7.然后开始安装,安装比较容易.最麻烦的就是如何安装WIn10系统呢?一开始我采取按部就班的方法,通过Mac自带的浏览器Safari去下载Win10 ISO的文件.结果速度太让人崩溃了,非常慢.后来我尝试把ISO通过百度网盘离线下载的方式先下载

洛谷 P3119 [USACO15JAN]草鉴定Grass Cownoisseur

P3119 [USACO15JAN]草鉴定Grass Cownoisseur tarjan缩点,正反spfa,枚举边,更新最大值 1 #include<bits/stdc++.h> 2 using namespace std; 3 #define maxn 1000000 4 #define inf 0x3f3f3f3f 5 int n,m,x[maxn],y[maxn],z,num,head[maxn],head2[maxn],tim,ans,tot,dis1[maxn],dis2[maxn

tophat的用法

概述:tophat是以bowtie2为核心的一款比对软件. tophat工作分两步: 1.将reads用bowtie比对到参考基因组上. 2.将unmapped-reads打断成更小的fragments,比对到参考基因组上,如果比对成功,建立剪切点. 用法:tophat [options]* <index_base> <reads1_1[,-,readsN_1]> [reads1_2,-readsN_2] <index_base>:参考基因组的index文件的具体目录,

tophat

tophat -p 4 -G  filter.gtf \ -o  /SRR222 \ /index \ SRR222.fastq tophat -p 4 -G  filter.gtf \ -o  /SRR222 \ /index \ SRR717.fastq,SRR718.fastq tophat -p 4 -G  filter.gtf \ -o  /SRR222 \ /index \ SRR669_1.fastq \ SRR669_2.fastq Usage:    tophat [optio

tophat安装

1 ? ? 依赖软件:bowtie,bowtie2,samtools,boost c++ library 2 ? ? 建立索引文件: ? ? ?bowtie包括bowtie,bowtie-build,bowtie-inspect ? ? ?bowtie2包括bowtie2,bowtie2-build,bowtie2-inspect,默认会找bowtie2 ? ? ?bowtie-build运行结果会得到一些.ebwt的文件 ? ? ?bowtie2-build建index,运行结果得到一些.bt

Mac下通过VMware Fusion安装centos虚拟机操作记录

下面介绍下利用VMware Fusion工具在Mac上安装centos虚拟机的做法:1)下载VMware Fusion工具下载地址(包括注册码):http://www.macx.cn/thread-2138527-1-1.html2)下载centos7的iso镜像3)点击下载的VMware-Fusion-8.0.0-2985594.dmg文件进行安装,安装好之后千万不要手欠去删除桌面上的VMware Fusion4)点击安装好的VMware Fusion 5)点击底部Dock栏中的VMware