【宏基因组】MEGAN4,MEGAN5和MEGAN6的Linux安装和使用

MEGAN(Metagenome Analyzer)是宏基因组学进行物种和功能研究的常用软件,实际上现在的Diamond+MEGAN6已经是一套比较完整的物种和功能注释流程了。

但是由于各种原因,我们在流程中使用的并非最新版。不同版本的MEGAN使用方法差别较大,尤其在命令行模式下。网上的关于这方面的资料也寥寥无几,这里简单记录下使用方法,主要是针对Linux平台的使用。

MEGANGUI版相对友好,如果你在Windows平台使用过该软件,那么在Linux上使用和理解起来相对容易些。

MEGAN 4

历史悠久,基本上已经淘汰了。命令行直接配置参数即可,貌似也不要license
示例如下:

xvfb-run.sh --auto-servernum --server-num=1  \MEGAN +g -x \"import blastfile=all.blastout_m8.add_taxoid meganfile=all.rma ;\recompute toppercent=5;\recompute minsupport=1;\update;\collapse rank=Species;\update;\select nodes=all;\export what=CSV format=readname_taxonid separator=tab file=all.result;\update;\close"

Megan的参数非常之多,以上仅列出了一些最主要的参数,+g表示开启非图形模式(即命令行模式),-x后接引号内的MEGAN参数,更多可参考MEGAN4 Manual。除了导入、导出之外,其中toppercent表示取比对数目的前百分之多少,minsupport表示至少取一条,collapse表层级折叠,select nodes表示选择方式。命令行中参数是一行一行处理的,所以要加入updates来链接命令。

MEGAN 5

主页download。需要用教育网邮箱注册获取license,将License certificate内容新建一个名为MEGAN5-academic-license.txt的文件保存。命令行使用时通过-L参数来指定它。
另外,MEGAN5需要新建一个参数配置文件,类似MEGAN4中的引号内容,以便MEGAN解析。为避免不同版本的差异,更多参数最好查看MEGAN5 Manual

例如,制作参数文件command.txt如下:

load taxRefSeqFile='./MEGAN/database/prot_acc2tax-Jul2019X1.abin';
import blastFile=Redtide.blastnr.all fastaFile=Redtide.fa  meganFile=tab.rma blastFormat=BlastTAB;
recompute toppercent=5;
recompute minsupport=1;
update;
collapse rank=Species;
update;
select nodes=all;
export what=CSV format=readname_taxonid separator=tab file=tab.result;
update;
quit;

网上有些很旧的资料,如http://seqanswers.com/forums/showthread.php?t=43535加载的是load taxGIFile=gi_taxid_prot.bin文件,但是GINCBI已经不再维护了,所以目前这个文件想下都下不到。包括blast比对的结果也不再显示GI号,仅显示accessionID。关于ID的解释,生信技能树有一篇总结比较全面,不了解的可以参考下。比较一下NCBIblast结果以前的和现在的区别:

现在MEGAN官网能下的数据库如下(与MEGAN6共用):
https://software-ab.informatik.uni-tuebingen.de/download/megan6/welcome.html


所以在参数文件中务必使用taxRefSeqFile=参数,而非taxGIFile=

命令行运行

xvfb-run.sh --auto-servernum --server-num=1 /software/bin/MEGAN/MEGAN -L MEGAN/MEGAN5-academic-license.txt -g -E -c command.txt

# 或
xvfb-run.sh --auto-servernum --server-num=1 /software/bin/MEGAN/MEGAN -L MEGAN/MEGAN5-academic-license.txt -g -E < command.txt

使用xvfb是为了虚拟化屏幕,在Linux上我们不想要MEGAN显示图形界面,阻止窗口弹出,只要它在运行就行了。不过这个工具如果在你们集群平台上没装,而你又没root权限的话,就得捣鼓半天了。

运行megan这一步一开始生成rma文件,导出后可得到accessionIDtaxID的对应关系。

接下来可以写个脚本通过Taxonomy数据库(下载地址)中的names.dmpnodes.dmp文件得到物种注释的结果了。

MEGAN 6

MEGAN6Community EditionUltimate Edition两个版本(download),因为后者需要license key,我试了下社区版的,貌似不支持Linux平台。

$ sh MEGAN_Community_unix_6_17_0.sh
No suitable Java Virtual Machine could be found on your system.
The version of the JVM must be at least 11.
Please define INSTALL4J_JAVA_HOME to point to a suitable JVM.

最终版本的MEGAN6命令行模式后续如果有需求再试试吧,应该和5差不多,因为两者的数据库文件都通用了。具体可参考MEGAN6 Manual

Ref:
http://mp.weixin.qq.com/s?__biz=MzIwNTEwMTUyOQ==&mid=2649693810&idx=2&sn=0264e78fac1dc6ffd3b8a3f6027e3669&chksm=8f2dbec4b85a37d23526e1996837f5f1ebcd41c220dde631855e6d27278c349fc1890ff45aba&scene=4#wechat_redirec
http://megan.informatik.uni-tuebingen.de/t/welcome-to-megan-metagenome-analyzer-community/8
http://blog.sina.com.cn/s/blog_83f77c940102wh7j.html
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1800929/pdf/377.pdf

原文地址:https://www.cnblogs.com/jessepeng/p/11750651.html

时间: 2024-10-26 02:44:35

【宏基因组】MEGAN4,MEGAN5和MEGAN6的Linux安装和使用的相关文章

宏基因组测序及分析

宏基因组测序: 浓度>=50ng/ul OD260/280:1.8-2.0 DNA两次需要量>=3ug 宏基因组测序需要提供什么样品要求? (1)提供环境微生物的基因组DNA或者扩增产物,OD值在1.8-2.0 之间:样品浓度大于30 ng/ul:每次样品制备需要10μg样品,如果需要多次制备样品,则需要样品总量=制备样品次数*10 ug. (2)DNA样品请置于-20℃保存:请提供DNA样品具体浓度.体积.制备时间.溶剂名称.请同时附上QC数据,包括电泳胶图.分光光度或Nanodrop仪器检

宏基因组扩增子图表解读2散点图:组间整体差异分析(Beta多样性)

散点图 数据点在直角坐标系平面上的分布图.在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CPCoA/CCA/RDA). Beta多样性 Beat多样性是生态学概念,专指不同组或生态位间物种组成的差异. 分析方法 在读文章中经常可以看到PCA分析.PCoA分析,NMDS分析,CCA分析,RDA分析.它们在本质上是排序(ordination)分析.排序的过程就是在一个可视化的低维空间(通常是二

在物种水平上的宏基因组比对分析流程

文章链接:http://biorxiv.org/content/early/2016/10/15/081141 作者:Yee Voan Teo, Nicola Neretti 时间:2016.10.15 摘要: 许多宏基因组分类工具在宏基因组学领域增长速度飞速.然而,在这个领域相近物种的分类仍然是一个挑战.这里,我们用两个宏基因组数据集,人类宏基因组数据和环境宏基因组数据对比MetaPhlAn2, kallisto 和 Kraken的性能.研究表明kallisto比MetaPhlAn2 和Kra

详解Linux安装GCC方法

转载自:http://blog.csdn.net/bulljordan23/article/details/7723495/ 下载: http://ftp.gnu.org/gnu/gcc/gcc-4.5.1/gcc-4.5.1.tar.bz2浏览: http://ftp.gnu.org/gnu/gcc/gcc-4.5.1/查看Changes: http://gcc.gnu.org/gcc-4.5/changes.htm 现在很多程序员都应用GCC,怎样才能更好的应用GCC.目前,GCC可以用来编

Linux安装fcitx输入法(命令安装)

Linux安装fcitx输入法(命令安装) 打开终端安装输入法 sudo apt-get install im-switch libapt-pkg-perl fcitx fcitx-table-wbpy 设置fcitx为默认输入法: im-switch -s fcitx 注销,重新登录 如果安装码表转换的话需要安装 sudo apt install fcitx-tools 将需要使用的输入法的码表文件拷贝到这个目录即可. [email protected]:/usr/share/fcitx/ta

linux安装(Ubuntu)——(二)

centos的安装参考: http://www.runoob.com/linux/linux-install.html Linux 安装(Ubuntu) 虚拟机:虚拟机(Virtual Machine),在计算机科学中的体系结构里,是指一种特殊的软件,他可以在计算机平台和终端用户之间建立一种环境,而终端用户则是基于这个软件所建立的环境来操作软件.在计算机科学中,虚拟机是指可以像真实机器一样运行程序的计算机的软件实现. 一.    安装Vmware 虚拟机 第一步:执行VMware-worksta

linux安装 apache2.2 django mod_wsgi

系统是ubuntu12.04 一.安装apache sudo apt-get install apache 启动:sudo apachectl start (开机默认启动的) 重启:sudo apachectl restart 关闭:sudo apachectl stop 安装之后在浏览器中访问127.0.0.1,如果出现"It works!" 这样的网页,说明安装成功啦. 二.安装mod_wsgi: 我在官网上下载的源码:https://code.google.com/p/modws

Linux安装Eclipse及项目部署

安装Eclipse 1. 首先解压Eclipse tar -zxvf eclipse-standard-kepler-SR1-linux-gtk.tar.gz -C user/local/src 2. 重新启动 加载JDK 3. 桌面创建快捷方式 Create Launcher 选择启动文件 切换图标 项目部署 1. 首先打开压缩文件 $ unzip text.zip 2. 然后修改 .sql文件的编码 查看文件编码 file bank.sql 修改文件编码 iconv -f GBK -t UT

搜狗输入法linux安装 以及 12个依赖包下载链接分享

搜狗输入法linux安装版,先安装各种依赖包,大概12个依赖,可能中途还需要其他依赖,可以效仿解决依赖问题.如图这12个文件要是手动点击下载,那也太笨点了,我们要用shell命令批量下载.命令如下:wget -c http://http.kali.org/pool/main/f/fcitx/fcitx-libs_4.2.8.5-2_amd64.debwget -c http://http.kali.org/pool/main/f/fcitx/fcitx-libs-qt_4.2.8.5-2_amd