扩增子分析解读6进化树 Alpha Beta多样性

分析前准备

# 进入工作目录
cd example_PE250

上一节回顾:我们的OTU获得了物种注释,并学习OTU表的各种操作————添加信息,格式转换,筛选信息。

接下来我们学习对OTU序列的进化分析、同时计算Alpha和Beta多样性值。

16. 进化树构建

进化树是基于多序列比对的结果,可展示丰富的信息,我们将在R绘图中详细解读。此处只是建树,用于Alpha, Beta多样性分析的输入文件。

# clustalo多序列比对,如果没有请安装Clustal Omega
clustalo -i result/rep_seqs4.fa -o temp/rep_seqs_align.fa --seqtype=DNA --full --force --threads=30
# 筛选结果中保守序列和保守区
filter_alignment.py -i temp/rep_seqs_align.fa -o temp/  # rep_seqs_align_pfiltered.fa, only very short conserved region saved
# 基于fasttree建树
make_phylogeny.py -i temp/rep_seqs_align_pfiltered.fasta -o result/rep_seqs.tree # generate tree by FastTree

17. Alpha多样性

Alpha多样性是计算样品内物种组成,包括数量和丰度两维信息。具体解释可见:扩增子图表解读1箱线图:Alpha多样性

Alpha多样性计算前需要对OTU表进行标准化,因为不同测序深度,检测到的物种数量会不同。我们将OTU表重抽样至相同数据量,以公平比较各样品的物种数量。方法如下:

# 查看样品的数据量最小值
biom summarize-table -i result/otu_table4.biom
# 基于最小值进行重抽样标准化
single_rarefaction.py -i result/otu_table4.biom -o temp/otu_table_rare.biom -d 2797
# 计算常用的四种Alpha多样性指数
alpha_diversity.py -i temp/otu_table_rare.biom -o result/alpha.txt -t result/rep_seqs.tree -m shannon,chao1,observed_otus,PD_whole_tree

18. Beta多样性

Beta多样性是计算各样品间的相同或不同,OTU表也需要标准化。采用重抽样方法丢失的信息太多,不利于统计。此步我们选择CSS标准化方法。

# CSS标准化OTU表
normalize_table.py -i result/otu_table4.biom -o temp/otu_table_css.biom -a CSS
# 转换标准化OTU表为文本,用于后期绘图
biom convert -i temp/otu_table_css.biom -o result/otu_table_css.txt --table-type="OTU table" --to-tsv
# 删除表格多余信息,方便R读取
sed -i ‘/# Const/d;s/#OTU //g;s/ID.//g‘ result/otu_table_css.txt
# 计算Beta多样性
beta_diversity.py -i temp/otu_table_css.biom -o result/beta/ -t result/rep_seqs.tree -m bray_curtis,weighted_unifrac,unweighted_unifrac
# Beta多样性距离文件整理,方便R读取
sed -i ‘s/^\t//g‘ result/beta/*
时间: 2024-08-05 07:05:00

扩增子分析解读6进化树 Alpha Beta多样性的相关文章

扩增子分析解读2提取barcode 质控及样品拆分 切除扩增引物

本节课程,需要完成扩增子分析解读1质控 实验设计 双端序列合并 先看一下扩增子分析的整体流程,从下向上逐层分析 分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们拿到了双端数据,进行了质控.并对实验设计进行了填写和检查.最后将双端数据合并为单个文件进行下游分析. 接下来我们将序列末端的barcode标签切下来,因为它们是人为添加的,不属于实验对象:再根据标签序列与实验设计文件比对,对每条序列属于哪个样品进行分类:最后我们切除掉扩增使用的引物,因为它们是人工合成的相似

扩增子分析解读3格式转换 去冗余 聚类

本节课程,需要完成扩增子分析解读1质控 实验设计 双端序列合并和2提取barcode 质控及样品拆分 切除扩增引物 先看一下扩增子分析的整体流程,从下向上逐层分析 分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们提取barcode,质控及样品拆分,切除扩增引物,经历了两节课6步数据处理才拿到我们扩增的高质量目的片段(貌似基因组/RNA-Seq测序结果直接就是这个阶段了,可以直接mapping) 接下来我们将这些序列去冗余.聚类为OTU.再去除嵌合体,这样就可以获得

扩增子分析解读4去嵌合体 非细菌序列 生成代表性序列和OTU表

本节课程,需要先完成 扩增子分析解读1质控 实验设计 双端序列合并 2提取barcode 质控及样品拆分 切除扩增引物 3格式转换 去冗余 聚类 先看一下扩增子分析的整体流程,从下向上逐层分析 分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们制作了Usearch要求格式的Fasta文件,对所有序列进行去冗余和低丰度过滤,并聚类生成了OTU. 接下来我们对OTU进一步去除嵌合体,并生成代表性序列和OTU表. 什么是chimeras(嵌合体)? 嵌合体序列由来自两条或

扩增子分析解读7物种分类统计 筛选进化树和其它

分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们获得了OTU序列的进化分析.同时计算Alpha和Beta多样性值. 本节是最后一节,我们对物种进行分类统计,筛选高丰度结果用于进化树展示,和其它用于R统计分析的结果生成 19. 按物种分类级别分类汇总 OTU表中最重要的注释信息是物种注释信息.通常的物种注释信息分为7个级别:界.门.纲.目.科.属.种.种是最小的级别,和OTU类似但有不相同. 我们除了可以比较样品和组间OTU水平差异外,还可以研究不同类似级别上的差异

扩增子分析解读1质控 实验设计 双端序列合并

本文采用目前最主流的扩增子测序数据类型HiSeq2500 PE250类型数据为例,结合目前主流方法QIIME+USearch定制的分析流程.本课程中所需的测序数据.实验设计和课程分析生成的中间文件,均可以直去百度云下载.链接:http://pan.baidu.com/s/1hs1PXcw 密码:y33d 本课程代码的运行,至少需要Linux平台+安装QIIME 1 分析前准备 # 建立工作目录并进入,-p参数为如果文件夹存在不报错 mkdir -p example_PE250 cd exampl

宏基因组扩增子图表解读2散点图:组间整体差异分析(Beta多样性)

散点图 数据点在直角坐标系平面上的分布图.在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CPCoA/CCA/RDA). Beta多样性 Beat多样性是生态学概念,专指不同组或生态位间物种组成的差异. 分析方法 在读文章中经常可以看到PCA分析.PCoA分析,NMDS分析,CCA分析,RDA分析.它们在本质上是排序(ordination)分析.排序的过程就是在一个可视化的低维空间(通常是二

扩增子图表解读1箱线图:Alpha多样性

箱线图 箱形图(Box-plot)又称为盒须图.盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图.因形状如箱子而得名.在宏基因组领域,常用于展示样品组中各样品Alpha多样性的分布 第一种情况,最大或最小值没有超过1.5倍箱体范围 第二种情况,最大或最小值超过1.5倍箱体范围,外位延长线外,即异常值(outliers) Alpha多样性 知识背景:Alpha多样性计算方法 常见的丰度估计方法有Shannon, Chao1和Observed OTU和PD whole tree等.我最喜欢

扩增子分析QIIME2分析实战Moving Pictures

本示例的的数据来自文章<Moving pictures of the human microbiome>,Genome Biology 2011,取样来自两个人身体四个部位五个时间点 进入环境 source activate qiime2-2017.6 退出环境 source deactivate 准备数据 # 创建并进入工作目录 mkdir -p qiime2-moving-pictures-tutorialcd qiime2-moving-pictures-tutorial # 下载实验设

C++alpha beta剪枝算法 实现4*4 tic-tac-toe

先上一张alpha beta原理图,一看就懂 代码有点长,主要是因为算评估值得时候用的是穷举. 玩家是1,电脑是2,可以选择难度以及先手. // // main.cpp // Tic-Tac-Toe // // Created by mac on 2017/4/2. // Copyright ? 2017年 mac. All rights reserved. // #include <iostream> #include <vector> #include <math.h&g