目录
- 目标物种和序列
- 相关Seq列表
- 多序列比对的原理和方法
- 相关的工具
- 建树的几种方法
- 实际操作
- Muscle&ClustalW
- 可视化结果
- newick文本
- MEGAX本地
- 构建流程
- 距离矩阵和自带建树
- 手动建树结果
- 关于NEWICK格式
- Muscle&ClustalW
相关链接
http://journals.sagepub.com/doi/10.3181/0903-MR-94 (冠状病毒的Minireview)
http://www.biotrainee.com/thread-2253-1-1.html (系统发育树相关)
https://blog.csdn.net/Cccrush/article/details/90695891 (详细介绍进化树的几种构建方法和原理)
目标物种和序列
物种:冠状病毒中能够感染人的7种病毒
序列来源:NCBI上已经公布的Ref序列,我们只采用了其中的6种。
相关Seq列表
多序列比对的原理和方法
相关的工具
- ClustalX/W(前者为图形界面,后者为命令行界面)
- T-Coffee工具
- MultAlin工具
- MAFFT工具
- MEGAX工具(常用)
建树的几种方法
- 非加权分组平均法( unweighted pair group method with arithmetic mean, UPGAM)
- 最小进化法( minimum evolution,ME)
- 最小二乘法( least squares,LS)
- 邻接法 (neighbor-joining, NJ)
以上的4种方法其实都属于距离法,即通过计算各物种之间的进化距离来作为建树的依据。
实际上还有一类建树的法则:Character-based methods 特征法,这里先跳过去,日后在看(挖坑ing)。
实际操作
Muscle&ClustalW
上面的几种工具在EBI的网站上都有公布(实际上里面还有很多的工具可以实现多序列比对),我们采用了其中的MUSCLE方法+ClustalW方法+MAFFT方法,能够直接得到最终的建树结果。
相关网页:
可视化结果
Muscle:Accurate MSA tool, especially good with proteins. Suitable for medium alignments.
ClustalW:New MSA tool that uses seeded guide trees and HMM profile-profile techniques to generate alignments. Suitable for medium-large alignments.
MAFFT:MSA tool that uses Fast Fourier Transforms. Suitable for medium-large alignments.
后面两个的结果相近,可能更加接近真实情况。
newick文本
# Muscle
(
(
KP198610:0.22253,
(
NC_002645.1:0.16531,
MK334047.1:0.15607)
:0.08099)
:0.01856,
NC_019843.3:0.22538,
(
NC_045512.2:0.09935,
NC_004718.3:0.10340)
:0.11661);
# ClustalW
(
(
NC_019843.3:0.23351,
(
NC_045512.2:0.09863,
NC_004718.3:0.10330)
:0.12454)
:0.02357,
KP198610:0.23317,
(
MK334047.1:0.16005,
NC_002645.1:0.16886)
:0.09141);
# MAFFT
(
KP198610:0.23000,
(
MK334047.1:0.15815,
NC_002645.1:0.16536)
:0.08813,
(
NC_019843.3:0.22966,
(
NC_045512.2:0.09772,
NC_004718.3:0.10361)
:0.12929)
:0.03177);
MEGAX本地
构建流程
graph TB;
Align -->Input_integrated_fasta;
Input_integrated_fasta --> Align_by_ClusterW;
Align_by_ClusterW --takes_long_time--> Phylogenetic_analysis_in_Data_option;
Phylogenetic_analysis_in_Data_option --> Compute_pairwise_distance_in_Distance_option;
距离矩阵和自带建树
手动建树结果
关于NEWICK格式
原文地址:https://www.cnblogs.com/zhengjm/p/12640256.html