MAFFT多重序列比对--(附比对彩标方法)

[转记]MAFFT多重序列比对图解教程

【絮语】

  一提到多重序列比对,很多人禁不住就想到ClustalW(Clustalx为ClustalW的GUI版),其实有一款多重序列比对软件-MAFFT,不论从比对速度(Muscle>MAFFT>ClustalW>T-Coffee),还是比对准确性(MAFFT>Muscle>T-Coffee>ClustalW)来说,其相比于ClustalW(或ClustalX)有过之而无不及,所以这里强烈推荐使用MAFFT这款多重比对软件。
   PS: 不同比对软件的比较,有兴趣的童鞋可以下载这篇文章看看:Alignment uncertainty and genomic analysis. Science, 2008
   MAFFT官方网站:http://mafft.cbrc.jp/alignment/software/
  支持平台:Mac OS X 、Linux、Windows 
  Windows 32位版本:http://mafft.cbrc.jp/alignment/software/mafft-7.037-win32.zip,64位版本:http://mafft.cbrc.jp/alignment/software/mafft-7.037-win64.zip,请根据自己操作系统选择相应版本下载。

                   图1 MAFFT主界面
  简明操作流程:
  1.载入序列文件  将FASTA格式的待比对序列文件(如:TMV.fas) 复制MAFFT的根目录下(当然也可以放任意位置,只有找得到),双击“mafft.bat”启动MAFFT,此时提示输入文件(Input file?),在@后面输入示例的TMV.fas,也可以直接将文件拖入窗口(注意有个+,说明当前是拖放状态),如下图所示:

  加载后回车,当显示“OK”时说明载入文件成功。

  2.设置输出信息  
  输出文件名称自定义,扩展名任意,这里保留原扩展名,输出文件名为TMV-out.fas,确定后回车。
  输出文件格式,建议用3或4,这里在@后输入4后回车,此时出现 MAFFT三种主要比对策略的5个选项,如下图:

  当你无法确定时候,建议用第1种的--auto模式,让MAFFT根据序列的特点自动选择相应的比对策略,输入1后回车。
  当不需要附带参数时,直接回车。
  3.开始多重比对
  一切设置完毕,输入“Y”回车,程序自动开始比对。


  当出现输出文件名,说明比对完成。

  4.后续着色美化 详见附录,不再赘述

附:多重序列比对的后期着色渲染
(1) Boxshade (黑白着色),在线网址:http://www.ch.embnet.org/software/BOX_form.html相关使用教程,请网上搜索本人写的《序列着色软件Boxshade图解教程(by raindy)》;
(2) ESPript 彩色着色,在线网址:http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi,效果图:

(3)TeXShade 自定义着色,详见日志: http://user.qzone.qq.com/58001704/blog/1367885081



附: 多序列比对的可视化显示

可能因为毕业论文内容论文需要,最近很多人都找我帮忙将clustal的序列比对文件结果可视化,现将TEXshade软件包能做出来的可视化效果分享给各位同学,因为使用TEXshade涉及到了一些LATEX知识,所以需要更深入的了解如何运作请给我留言或者私聊,此文仅将软件能做出的效果展示,虽然其实软件很简单,但不做具体使用说明,我的风格通常是授人以鱼,不授人以渔。

最简单的莫过于纯粹的多序列比对排版,跟某些同学论文里面用Word排版的效果类似(word里面需要用等宽字体),效果类似如下:

如果稍微加点效果可能就变成了如下的样子,我们将相同的氨基酸标记出来:

当然,TEXshade能做的不仅仅是这些,下面这张图我们标记了其中的几个关键位置,去掉了右侧的“ruler”

好像这个样子就有点乱了

下面这幅就更详细一点了,我用不同的颜色代表了不同的conservation

很多情况下,我们只想呈现多序列中的某些突变位点,其实也可以很好的表达

如果将T-Coffee 的 score_ascii 文件一并输入TEXshade,效果我觉得很帅气
 

我遇到过很多可视化表达各种结构域的例子,下面的表示是不是很帅呢?

下面是另外的一些功能实例

下面的被称为Sequence fingerprints,其实加上fingerprint命令就可以直接出图了。

很早的时候,看到序列的LOGO图觉得很帅气,下面的Logo图你见过么?

下面再给大家分享几个例子,其实TEXshade能做的很多,要靠大家的想象,我一向认为,只要人能想得出,数据可视化就能做得到。


所属相册:数据可视化

其实很多人都会觉得这么漂亮的图肯定做出来很复杂,其实TEXShade需要的很简单,输出上面的结果其实也就是几分钟的事情,前提是需要你准备好需要展示的序列,记录好要标注的位置就OK!

例如:对于下面这个看似复杂的可视化结果,其实我们需要的代码很少,只需要5行代码就足够了!

上图对应的TEX代码:

第一行指定了我们的输入文件,通常是比对的结果文件
第二行是指定了TEXshade的显示模式,这里用根据 不同 functional groups的chemical properties标注颜色
第三行是表示只显示第一条序列(AQP1.PRO)138-170个碱基范围
第四号表示显示 legend
第五行表示代码结束

本文引用地址:http://blog.sciencenet.cn/blog-460481-706083.html 此文来自科学网高芳銮博客,转载请注明出处。

个人分类:软件教程|系统分类:科研笔记|关键词:MAFFT 多重比对

时间: 2024-11-05 23:30:50

MAFFT多重序列比对--(附比对彩标方法)的相关文章

警告1909。无法创建快捷方式VMware Workstation Pro.Ink。解决方法(附 VMware_workstation 12的安装方法)

电脑之前装过VMware 10,很长时间没用就卸载了,也没有在意卸载的干不干净,直到最近需要用Linux系统,重新安装了VMware 12,就出现下面这样的情况: 警告1909.无法创建快捷方式VMware Workstation Pro.Ink. 从网上找了各种办法试过之后都不太理想,后来仔细看看上面的提示,意思是说无法创建快捷方式,可能是用户在快捷方式文件夹的读写权限不够,那就去找到存放快捷方式的文件夹去试试: 就是下面这个路径,就可以找到快捷方式文件夹! C:\ProgramData\Mi

jQuery视差滚动插件,(附原理分析,调用方法)

演示地址:http://www.jq22.com/jquery-info1799 jquery插件,使用验证过可用. 分析源代码后总结原理:设置background样式为fixed,判断浏览器滚动距离,当在视窗范围内时,调用$(window).scroll.并根据所设置的速度比例,进行同步滚动. 调用时,设置三个必要参数:data-speed,data-type,background样式为fixed <div data-speed="4" data-type="back

安全运维之:Linux后门入侵检测工具,附最新bash漏洞解决方法

一.rootkit简介 rootkit是Linux平台下最常见的一种木马后门工具,它主要通过替换系统文件来达到入侵和和隐蔽的目的,这种木马比普通木马后门更加危险和隐蔽,普通的检测工具和检查手段很难发现这种木马.rootkit攻击能力极强,对系统的危害很大,它通过一套工具来建立后门和隐藏行迹,从而让攻击者保住权限,以使它在任何时候都可以使用root权限登录到系统. rootkit主要有两种类型:文件级别和内核级别,下面分别进行简单介绍. 1.文件级别rootkit 文件级别的rootkit一般是通

unix网络编程各种TCP客户-服务器程序设计实例附环境搭建和编译方法(一)

一,到http://download.csdn.net/detail/ts173383201/4505201去下载源代码,然后解压: 二,cd到你解压后的文件夹下,就是有configure的那个目录下,执行命令./configure: 三,执行cd lib跳到lib目录下,执行make命令,会在上层目录(就是刚才有configure那个目录)生成libunp.a文件 四,复制这个静态库libunp.a到/usr/lib/和/usr/lib64/中; 五,接下来在目录中找到unp.h和config

Sublime Text 3.1 3170 / 3176 注册码(附降级与禁止更新方法)

3.1 3176 可用注册码 127.0.0.1 www.sublimetext.com 127.0.0.1 license.sublimehq.com ----- BEGIN LICENSE ----- sgbteam Single User License EA7E-1153259 8891CBB9 F1513E4F 1A3405C1 A865D53F 115F202E 7B91AB2D 0D2A40ED 352B269B 76E84F0B CD69BFC7 59F2DFEF E267328

ios多线程使用之细细细~解

在开发中经常会用到多线程来处理一些比较耗时的任务,比如下载的时候存储数据.当进入一个新页面的时候将网络请求放在后台,数据下来之后再到主线程来将数据展示出来等操作,以此来满足用户大老爷的体验,让他们开开心心的用我们开发出来的应用而不是用的时候一脸懵逼的等待响应T T.平常在开发的过程中,我们只需将耗时应用放在后台的子线程.任务结束之后回到主线程来刷新页面就好了.基本下面的几行代码是我们最常用到的: dispatch_async(dispatch_get_global_queue(0, 0), ^{

【BZOJ1229】【USACO 2008 Nov Gold】 4.Toys sadstory 三分+贪心

sad story:我们自己oj的数据貌似有点问题.标程WA了5% 题解: 复制去Google翻译翻译结果 首先引一下VFK神犇的证明来证明一下这道题是三分.. { 我来告诉你世界的真相 = = 因为这题能最小费用最大流 每次最短路长度不降 所以是单峰的 最短路长度就是差分值.. 所以一阶导不降.. 是不是简单粗暴 你要证函数是单峰的. 当然是证斜率什么的 } 三分完初始买了多少个玩具,然后就是贪心. 首先我想说这个贪心真动规.虽然它真的是贪心. 首先先说一种错误的贪心. 就是从前往后扫,优先用

世界杯新手投注问答

世界杯在巴西如火如荼的进行,各位淘宝的彩民也是热火朝天的竞猜投注博大奖.当然除了资深彩民之外,还有一些新的淘友加入到了竞猜世界杯的行列.为了帮助大家更轻松的投注,我们整理了一些世界杯期间投注的常见问题,希望能帮到大家. 1. 足彩彩果认定规则? 正常比赛时间90分钟的比分为准(含伤停补时),不包括加时赛. 2. 奖金计算公式 竞彩足球:返奖金额=赔率(即sp值)连乘×2元×投注倍数 竞彩足球SP值以该订单实际出票时sp值为准,可在我的彩票订单里查询 竞彩足球的赔率(SP值)是中国体彩中心统一给出

高级UI交互设计师就业班(签约就业)

联系人:杨老师联系手机:15618824377 联系电话:021-60907382联系QQ:1253379395一.第一阶段(美学设计与软件技能)1.商务办公:windows.word.excel.ppt办公应用:办公软件在专业中的应用2.美术设计基础:设计素描.水粉.速写的原理及实践,投影.视图.透视,灯光表现,户外写生3.美术设计提高:设计素描.水粉提高课程.光和影的写实手法.审美观念的提高.色彩搭配的提高,配色原理的提高.4.手绘图标:二维剪影图标.三维写实图标案例实训,了解创意在设计中的