hmmer 使用

hmmer 使用

 » 转载文章请注明,转载自:博耘生物 » 《hmmer的安装与使用》

 » 原文链接:http://boyun.sh.cn/bio/?p=1753

从功能基因研究的角度来讲,相关的搜索,比如从序列数据库中,找同源的序列,或者对一个对一个新的基因功能进行鉴定,使用hmmer比使用blast有着更高的灵敏度已经更高的搜索速度,但其应用还远没有blast普及,这里是一篇入门级的介绍文章。

hmmer下载与安装

对于Mac OS/X, Linux, UNIX系统,用源代码编译安装:

   % wget ftp://selab.janelia.org/pub/software/hmmer3/3.0/hmmer-3.0.tar.gz
   % tar zxf hmmer-3.0.tar.gz
   % cd hmmer-3.0
   % ./configure
   % make
   % make check

windows系统,直接下载二进制压缩包,解压就可以使用,下载地址:
http://hmmer.janelia.org/static/binaries/hmmer3.0_windows.zip

hmmer包含的程序

  • phmmer: 与Blastp类似,使用一个蛋白质序列搜索蛋白质序列库;
    > phmmer tutorial/HBB HUMAN uniprot sprot.fa
  • jackhmmer: 与psiBlast类似,蛋白质序列迭代搜索蛋白质序列库;
    > jackhmmer tutorial/HBB HUMAN uniprot sprot.fa
  • hmmbuild: 用多重比对序列构建HMM模型;
  • hmmsearch: 使用HMM模型搜索序列库;
  • hmmscan: 使用序列搜索HMM库;
  • hmmalign: 使用HMM为线索,构建多重比对序列;
    > hmmalign globins4.hmm tutorial/globins45.fa
  • hmmconvert: 转换HMM格式
  • hmmemit: 从HMM模型中,得到一个模式序列;
  • hmmfetch: 通过名字或者接受号从HMM库中取回一个HMM模型;
  • hmmpress:格式化HMM数据库,以便于hmmscan搜索使用;
  • hmmstat: 显示HMM数据库的统计信息;

使用HMM模型搜索序列数据库

  1. 使用hmmbuild构建HMM模型,输入为Stockholm格式或者FASTA格式的多重比对序列文件(如:tutorial/globins4.sto),命令如下:
    > hmmbuild globins4.hmm tutorial/globins4.sto
    globins4.hmm为输出的HMM模型
  2. 使用hmmsearch搜索蛋白质序列数据库,蛋白质序列数据库为FASTA格式,命令如下:
    > hmmsearch globins4.hmm uniprot sprot.fasta > globins4.out
    globins4.out为输出的结果文件,如下:

*示例使用官方教程中的示例

使用蛋白质序列搜索HMM数据库

  1. 构建HMM数据库,HMM数据库是包含多个HMM模型的文件,可以从Pfam、SMART、TIGRFams下载,也可以自己由多重比对序列集中构建,如:
    > hmmbuild globins4.hmm tutorial/globins4.sto
    > hmmbuild fn3.hmm tutorial/fn3.sto
    > hmmbuild Pkinase.hmm tutorial/Pkinase.sto
    > cat globins4.hmm fn3.hmm Pkinase.hmm > minifam
  2. 使用hmmpress格式化数据库,包括压缩以及创建索引,命令如下:
    > hmmpress minifam
    这个步骤可以很快的执行完成,输出的内容如下:
    Working… done.
    Pressed and indexed 3 HMMs (3 names and 2 accessions).
    Models pressed into binary file: minifam.h3m
    SSI index for binary model file: minifam.h3i
    Profiles (MSV part) pressed into: minifam.h3f
    Profiles (remainder) pressed into: minifam.h3p
  3. 使用hmmscan搜索HMM数据库,命令如下:
    > hmmscan minifam tutorial/7LESS_DROME
    输出如下:

后记

这里主要是一个入门式的教程,介绍了hmmer的安装,以及最常用功能使用的命令示例。其他程序的使用,以及每个程序的详细参数说明,请参看官方手册,
官方文档手册(pdf):ftp://selab.janelia.org/pub/software/hmmer3/3.0/Userguide.pdf

使用中,遇到的问题,或者疑难,可以留言讨论。

时间: 2024-12-24 18:22:12

hmmer 使用的相关文章

Hmmer安装与使用

Hmmer的安装与使用 从功能基因研究的角度来讲,相关的搜索,比如从序列数据库中,找同源的序列,或者对一个对一个新的基因功能进行鉴定,使用hmmer比使用blast有着更高的灵敏度已经更高的搜索速度,但其应用还远没有blast普及. hmmer下载与安装 对于Mac OS/X, Linux, UNIX系统,用源代码编译安装: % wget ftp://selab.janelia.org/pub/software/hmmer3/3.0/hmmer-3.0.tar.gz % tar zxf hmme

spec2006中精确的simulation points执行点

使用测试集spec2006测试cpu性能时,如果完全跑完所有程序,需要数周甚至数月,周期非常长,想得到实验结果,黄花菜都凉了!现在比较认可的做法是从simulation point开始运行,那么如何生成它呢? 使用simpoints工具,自己从头到尾跑一遍生成BBV,再寻找simpoints: 使用前人的现有的simpoints结果,spec2006_simpoints,来源于http://www.freewebs.com/gkofwarf/simpoints.htm,作者信息,该文档包含21个

Xen、KVM和VirtualBox比拼

vbox 与 kvm 的区别: vbox 是由 qemu 改写而成,包含大量 qemu 代码.可以使用于 不支持 虚拟化的cpu.值得说的一点:vbox 在图形方面比较好,能进行2D 3D加速.cpu控制不理想(估计是因为图形支持的缘故).操作上有独立的图形界面,易于上手. kvm 是linux内核包含的东西,使用qemu作为上层管理(命令行).cpu 必须支持虚拟化.性能,作为服务器很好,可是图形能力十分的差.即使放电影,图像也是像刷油漆一样,一层一层的.cpu使用率控制很好. 控制上比较简洁

HMMPfam的安装使用手记(转载)

转载至:http://blog.sina.com.cn/s/blog_3f6403290100rb61.html(感谢原文作者) HMMPfam的安装使用手记前言 简要介绍一下 HMMPfam吧.这还要从HMMER说起,HMMER是基于隐马尔可夫模型(profile HMMs),用于生物序列分析工作的一个非常强大的软件包,而hmmpfam就是HMMER软件包中的一个重要组成部分.同时,我们还需要了解Pfam (Protein families database of alignments and

gem5: 可运行的spec2006 benchmark总结

gem5中运行spec2006的环境: ALPHA架构: 需要通过alpha交叉编译工具链编译spec2006: 需要设置静态编译环境,优化选项-static: 准备benchmark运行所需要的exe和input,最好将他们全部放在一个文件夹中: 本文采用ref数据集,实际上有些测试集需要all里面的数据: 根据gem5中运行spec2006的步骤设置好benchmark运行环境后,即可逐个测试benchmark是否可以运行. 根据自己的需求修改run_gem5_alpha_spec06_be

Spec2006使用说明

Spec2006使用说明 五 10 十月 2014 By penglee 工具介绍 SPEC CPU 2006 benchmark是SPEC新一代的行业标准化的CPU测试基准套件.重点测试系统的处理器,内存子系统和编译器.这个基准测试套件包括的SPECint基准和SPECfp基准. 其中SPECint2006基准包含12个不同的基准测试和SPECfp2006年基准包含19个不同的基准测试.SPEC设计了这个套件提供了一个比较标准的计算密集型,高性能的跨硬件的CPU测试工具.在SPEC CPU 2

RepeatModeler安装及使用

如果进行重复序列的预测,则使用RepeatModeler,可自身比对进行查找 安装 (1)下载地址:http://www.repeatmasker.org/RepeatModeler/ (2)RepeatModeler安装之前需要安装以下软件 perl RECON - De Novo Repeat Finder;  鉴定重复家族 RepeatScout - De Novo Repeat Finder; 从基因组中鉴定重复序家族序列 TRF - Tandem Repeat Finder RMBla