利用USearch去除嵌合体(chimeras)

嵌合体序列指在pcr过程中,两条不同的序列产生杂交扩增的序列,属于人工污染,在ITS和16S分析中,应该首先去除,USearch提供去除嵌合体的功能

usearch -uchime_ref reads.fna -db reference.fna -strand plus -nonchimeras nonchimeras.fna

usearch 链接:http://drive5.com/usearch/manual/uparse_cmds.html

同时usearch提供更加可靠的聚类方案(未详考),聚类流程:

1  usearch -derep_fulllength nonchimeras.fna -output derep.fa -sizeout

计算reads丰度(完全一样的reads数量)

2  usearch -sortbysize derep.fa -output sorted.fa -minsize 2

按照reads丰度排序,并且去除丰度为1的reads

3  usearch -cluster_otus sorted.fa -otus otus1.fa

聚类

4  python  fasta_number.py otus1.fa OTU_ > otus.fa

OTU命名

5  usearch -usearch_global nochimeras.fa  -db otus.fa  -strand plus -id 0.97 -uc map.uc

制作uc文件

6  根据uc文件制作 otu.table

时间: 2024-10-30 09:56:30

利用USearch去除嵌合体(chimeras)的相关文章

apk去广告工具(利用apktool去除apk文件里的广告)

基本知识 apk安装包的文件结构 以知名桌面软件“LauncherPro”为例,apk安装包文件目录: 文件目录如下: - META-INF - res - anim - color - drawable - drawable-hdpi - drawable-land - drawable-land-hdpi - drawable-mdpi - drawable-port - drawable-port-hdpi - layout - layout-land - layout-port - xm

利用正则表达式去除所有html标签,只保留文字

后台将富文本编辑器中的内容返回到前端时如果带上了标签,这时就可以利用这种方法只保留文字. 标签的格式有以下几种 1.<div class="test"></div> 2.<img /> 3.自定义标签<My-Tag></My-Tag> 针对以上几种标签,确定的正则的规则是 reg=/<\/?.+?\/?>/g <表示尖括号 第一个\/?表示</div>这种标签的情况 .+?表示将中间所有内容替代掉

利用正则表达式去除字符串中非数字字符

string a ="bkbk9*2.6/7"; 1.去除字符串中非数字 a = Regex.Replace(a, @"[^\d]*", "");//需用到引用usingSystem.Text.RegularExpressions; 去除后a="9267"; 2.去除字符串中数字 a = Regex.Replace(a, @"[^\d]*", "");//需用到引用usingSystem

利用正则表达式去除html标签

 var reg=/<\/?.+?\/?>/g stepsC.map((item,index)=>{ this.steps.push({desc:item.CellContent.replace(reg,'')}) }) 原文地址:https://www.cnblogs.com/lxsunny/p/11997006.html

扩增子分析解读4去嵌合体 非细菌序列 生成代表性序列和OTU表

本节课程,需要先完成 扩增子分析解读1质控 实验设计 双端序列合并 2提取barcode 质控及样品拆分 切除扩增引物 3格式转换 去冗余 聚类 先看一下扩增子分析的整体流程,从下向上逐层分析 分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们制作了Usearch要求格式的Fasta文件,对所有序列进行去冗余和低丰度过滤,并聚类生成了OTU. 接下来我们对OTU进一步去除嵌合体,并生成代表性序列和OTU表. 什么是chimeras(嵌合体)? 嵌合体序列由来自两条或

24、嵌合体序列

转载:http://www.cnblogs.com/xudongliang/p/6497465.html 嵌合体序列:由来自两条或者多条模板链的序列组成,示意图如下: 在PCR反应中,在延伸阶段,由于不完全延伸,就会导致嵌合体序列的出现,以上图为例, 在扩增序列X的过程中,在序列延伸阶段,只产生了部分X序列延伸阶段就结束了,在下一轮的PCR反应中,这部分序列作为其相似序列Y的引物接着延伸,扩增就会形成X和Y的嵌合体序列: 在放一张具体一点的示意图,不完全延伸产生的序列作为下一轮PCR反应的产物,

如何利用工具提高工作效率

作为IT从业者,我每天的工作都是和电脑打交道,因此这几年来多少积累了些让自己受益的提高效率的工具,但一直没有系统地整理过这方面的经验.直到上周一个同事问我:怎么让在公司电脑上的工作同步到家里的电脑上,然后在家也可以把工作做好.我告诉了她可以用百度云盘以及有道云笔记等工具实现.因此我意识到很多对我来说已经稀疏平常的软件工具,其实对很多不擅长电脑技术的人来说,确是需要有人告诉他去了解并花点功夫去掌握的.科技存在的意义本应该就是改善人们生活的质量的,我希望做这个理念的倡导者和践行者,因此下面介绍一下我

【Discuz】去除版权信息,标题栏与底部改动

这篇文章尽管是介绍怎么把Discuz!的版权信息怎么搞得无影无踪,可是还是建议在不影响论坛视觉效果的情况下,保留Discuz的版权信息,毕竟它为我奉献了一个这么出色的开源论坛的phpproject.主要是利用思考去除版权信息的契机,学会改动Discuz!project的标题栏与底部. 这里以默认模板,没有作不论什么改动的Discuzproject为例. Discuz!的版权信息首先是存在与两个地方.一个是标题栏,一个是底部. 首先,Discuz的标题栏文件藏在..\template\defaul

【Discuz】去除版权信息,标题栏与底部修改

这篇文章虽然是介绍怎么把Discuz!的版权信息怎么搞得无影无踪,但是还是建议在不影响论坛视觉效果的情况下,保留Discuz的版权信息,毕竟它为我奉献了一个这么出色的开源论坛的php工程.主要是利用思考去除版权信息的契机,学会修改Discuz!工程的标题栏与底部. 这里以默认模板,没有作任何修改的Discuz工程为例. Discuz!的版权信息首先是存在与两个地方,一个是标题栏,一个是底部. 首先,Discuz的标题栏文件藏在..\template\default\common\header_c