【宏组学】如何根据taxid（或taxname）快速获得taxname（或taxid)?

需求

我有一个物种taxonomy ID的list，想获得相应的物种名，不要一个个去NCBI Taxonomy官网查。反之根据物种名list查询对应的taxid。

实现

因为之前没怎么用过，我的第一个想法是通过下载到集群的taxonomy数据库文件来匹配。一般下载下来的数据库会有names.dmp和nodes.dmp文件，分别是物种层级关系文件和taxid与物种名对应文件。但我想要的只是species这个层级的，所以要结合这两个文件写个小程序才能实现，并且很可能出错，因为我不知道到底哪个才是标准的species name。

比如说，我想要知道taxid为10090的物种名，在names.dmp文件中有如下这么多对应关系：

其实，NCBI的Taxonomy数据库自带了一个叫TaxIdentifier的工具（https://www.ncbi.nlm.nih.gov/Taxonomy/TaxIdentifier/tax_identifier.cgi），可以轻松转换。

如上图我输入一个taxid list，直接得到以下结果：

通过选择full taxid lineage，也可以得到该物种的所有谱系关系：

反过来，通过taxname来获得taxid也是一样的，不过要注意名字的规范性。

可见在生物学问题研究上，很多轮子已经造成了，要学会搜索和使用。关键还是需求问题。

原文地址：https://www.cnblogs.com/jessepeng/p/11969941.html

时间： 2024-10-23 14:10:39

【宏组学】如何根据taxid（或taxname）快速获得taxname（或taxid)?的相关文章

解读人：范徉，Methylome and Metabolome Analyses Reveal Adaptive Mechanisms in Geobacter sulfurreducens Grown on Different Terminal Electron Acceptors（甲基化组学和代谢组学分析发现Geobacter sulfurreducens生长在不同电子终受体中的适应机制）

一. 概述: Geobacter sulfurreducens乃一种能量代谢方式为化能异养的厌氧格兰仕阴性细菌,它在无氧条件下通过TCA循环消耗有机物产生电子,以高价铁化合物为电子受体完成电子转移.该研究使用三代测序技术(SMRT)测定了生长在3种包含不同电子受体的培养基,柠檬酸铁,水合氧化铁和延胡索酸中的Geobacter sulfurreducens的甲基化组学.该研究还利用GC-MS分析了3种生长条件下的Geobacter sulfurreducens的代谢组学,并在最后测定了3种生长条件

蛋白组学定量值得比较说明

1. Maxquant的iBAQ和LFQ,该用哪个?我们使用Maxquant做Label Free蛋白质组学定量分析的时候,在Maxquant的参数设置时,会遇到两个参数,LFQ和iBAQ,那么,选择哪个好呢?如果你都选上,在最终的proteingroups.txt中,会出现三列:Intensity.IBAQ.LFQ intensity,这三列中的数字,也就是蛋白的定量强度,并不一样,那么,到底那一列比较准呢?首先,让我们来看一下三者的计算原理是什么?> Intensity是将某Protein

多组学讲座汇总

整理了一下以质谱技术为核心的多组学方面的讲座,主要是中科新生命的,感觉质量还可以,适合入门观看.是直播课,首次应该需要填写资料才能进入直播间. 生命表型体现者,从"代谢到脂质到修饰"组学专场报告 http://xy.bioon.com/live/webinar_play_new/442.html 蛋白翻译后修饰组学技术(PTMScan?)在精准医学中的应用 http://xy.bioon.com/live/webinar_play_new/441.html 打通表型与调控机制的代谢通路

Development of a High Coverage Pseudotargeted Lipidomics Method Based on Ultra-High Performance Liquid Chromatography?Mass Spectrometry（基于超高效液相色谱-质谱法的高覆盖拟靶向脂质组学方法的开发）

文献名:Development of a High Coverage Pseudotargeted Lipidomics Method Based on Ultra-High Performance Liquid Chromatography−Mass Spectrometry(基于超高效液相色谱-质谱法的高覆盖拟靶向脂质组学方法的开发) 期刊名:Analytical Chemistry 发表时间:(2018年5月) IF:6.38 单位: 中国科学院大连化学物理研究所中国科学院大学生物材料

ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets（大规模蛋白组学数据集中鉴定和定量蛋白复合物）

文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物) 期刊名:Mol Cell Proteomics 发表时间:(2019年11月) IF:4.828 单位:南丹麦大学生物化学与分子生物学系和VILLUM生物分析科学中心物种:人和小鼠技术:ComplexBrow

【宏组学】如何根据taxid（或taxname）快速获得taxname（或taxid)?

需求

实现

【宏组学】如何根据taxid（或taxname）快速获得taxname（或taxid)?的相关文章

解读人：范徉，Methylome and Metabolome Analyses Reveal Adaptive Mechanisms in Geobacter sulfurreducens Grown on Different Terminal Electron Acceptors（甲基化组学和代谢组学分析发现Geobacter sulfurreducens生长在不同电子终受体中的适应机制）

蛋白组学定量值得比较说明

多组学讲座汇总

Development of a High Coverage Pseudotargeted Lipidomics Method Based on Ultra-High Performance Liquid Chromatography?Mass Spectrometry（基于超高效液相色谱-质谱法的高覆盖拟靶向脂质组学方法的开发）

ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets（大规模蛋白组学数据集中鉴定和定量蛋白复合物）

【代谢组学】2.代谢物鉴定

【代谢组学】3.数据分析

【代谢组学】5.功能分析

独家讲解分析《组三组六必中技巧》助你快速掌握