解读人:刘佳维,Spectral Clustering Improves Label-Free Quanti?cation of Low-Abundant Proteins(谱图聚类改善了低丰度蛋白的无标记定量)

一、 概述:(用精炼的语言描述文章的整体思路及结果)

本文选择四个不同的数据集,分为基于谱图数计数和基于峰值强度计数的无标记定量两种情况,对谱图进行聚类算法分析,提高了低丰度蛋白的可检测性,并开发了可直接使用的聚类方法的PD节点。

二、 研究背景:

无标记量化已成为许多基于质谱的蛋白质组学实验中的常见做法。近年来,聚类方法可以改善蛋白质组学数据集的分析的结论已广泛被人们所接受。本文旨在利用光谱聚类推断额外的肽谱匹配,并提高数据集中的无标记定量蛋白质组学数据的质量,改善低丰度蛋白的定量结果,同时提高了衍生定量数据的准确性,且没有增加数据集的噪声。

 

三、 实验设计:

图 1:基于谱图计数和基于强度计数两种方法对LFQ进行聚类以得到额外PSMs的工作流程。

名词解释:

LFQ:Label-Free Quantification,无标记定量;

MGF:Mascot genetic format,一种文件格式;

PSMs:peptide spectrum matches,匹配到的肽段谱图;

MSGF+/X!tandem:常用的搜库软件;

MS-Amanda:PD中常用的搜索算法;

apQuant:通过质量过滤使LFQ的结果更准确。

四、研究成果:

1、以在酵母蛋白环境下加入不同浓度的做了标记的UPS1蛋白的样品进行常规蛋白分析得到ms谱图,这些UPS1蛋白即为所用样品中的用来检测结果的低丰度蛋白,然后在搜库时选择是否使用聚类方法并将检测到的标记低丰度蛋白量进行比对,结果如图2。可以看出在低浓度情况下使用聚类方法检测到的低丰度蛋白量提升更明显。

图 2:横坐标为加入的不同摩尔数的标记UPS1蛋白,纵坐标为检测到的标记UPS1蛋白量,并根据是否使用聚类算法将结果表示为橙绿两种颜色。其中:(A)基于谱图数计数,分别使用MSGF+与X!Tandem搜索引擎;(B)基于峰强计数,并分为是否使用MBR(match-between-runs,边运行边匹配)两种情况。

2、将结果蛋白中有标记的视为真阳性,属于背景蛋白的视为假阳性,通过改变判断结果蛋白是否达标的阈值,绘制出聚类方法在不同情况下与常规方法效果的比对图,曲线面积越大说明越能在更低的假阳性率下获得更高的真阳性率。从图中我们可以看出聚类方法在大部分情况下都对结果有所改善。

图 3:分别使用limma对(A,B)和edgeR对(C)做出统计分析,横坐标为假阳性率,纵坐标为真阳性率,线的颜色代表是否使用聚类方法,虚实代表是否使用MBR(A,B)或所用搜索引擎种类(C)。 其中:(A)基于峰强计数,使用三个CPTAC数据集得到的结果。 (B)基于峰强计数,三种浓度比得出结果。(C)基于谱图数计数,三种浓度比得出结果。

文章亮点:

本文最大的亮点在于将其开发的光谱聚类算法整合到了广泛使用的PD软件套件中,使其更容易被更广泛的蛋白质组学界所用。能直接使用的PD节点可在http://ms.imp.ac.at/?goto=spectra-cluster 下载。此外,聚类方法不依赖数据库,但可以直接使用库里的谱图,这使其有着更高的灵敏度。

原文地址:https://www.cnblogs.com/ilifeiscience/p/10709102.html

时间: 2024-10-08 08:14:06

解读人:刘佳维,Spectral Clustering Improves Label-Free Quanti?cation of Low-Abundant Proteins(谱图聚类改善了低丰度蛋白的无标记定量)的相关文章

Comparing Data-Independent Acquisition and Parallel Reaction Monitoring in Their Abilities To Differentiate High-Density Lipoprotein Subclasses 比较DIA和PRM区分高密度脂蛋白亚类的能力 (解读人:陈凌云)

文献名:Comparing Data-Independent Acquisition and Parallel Reaction Monitoring in Their Abilities To Differentiate High-Density Lipoprotein Subclasses(比较DIA和PRM区分高密度脂蛋白亚类的能力) 期刊名:Journal of Proteome Research 发表时间:2019年11月 IF:3.78 单位: 圣保罗大学 Universidade

谱聚类(spectral clustering)及其实现详解

Preface 开了很多题,手稿都是写好一直思考如何放到CSDN上来,一方面由于公司技术隐私,一方面由于面向对象不同,要大改,所以一直没贴出完整,希望日后可以把开的题都补充全. 先把大纲列出来: 一.从狄多公主圈地传说说起 二.谱聚类的演算 (一).演算 1.谱聚类的概览 2.谱聚类构图 3.谱聚类切图 (1).RatioCut (2).Ncut (3).一点题外话 (二).pseudo-code 三.谱聚类的实现(scala) (一).Similarity Matrix (二).kNN/mut

Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning (解读人:闫克强)

文献名:Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning(利用质谱技术和机器学习模型在尿液样本中快速准确地进行菌种鉴定) doi: 10.1074/mcp.TIR119.001559 期刊名:Mol Cell Proteomics 作者:Florence Roux-Dalvai 通讯作者:Arnaud

Name Disambiguation in Author Citations using a Kway Spectral Clustering Method 论文之摘要

研究背景 要解决的问题 名字歧义问题会带来文献检索.网络搜索以及数据库整合上带来效率问题还可能对作者带来名誉上的问题.解决的两种名字歧义问题:1.一个作者实体却有多个相似(被简写)的或者被误拼的名字.2.多个不同的作者实体共享同一个名字(被简写或名字一样). 前人研究现状 前人采用的方法 记录连接(record linkage) 重复记录检测和消除(duplicate record detection and elimination) 合并/清除(merge/purge) 数据关联(data a

漫谈 Clustering (4): Spectral Clustering

如果说 K-means 和 GMM 这些聚类的方法是古代流行的算法的话,那么这次要讲的 Spectral Clustering 就可以算是现代流行的算法了,中文通常称为“谱聚类”.由于使用的矩阵的细微差别,谱聚类实际上可以说是一“类”算法. Spectral Clustering 和传统的聚类方法(例如 K-means)比起来有不少优点: 和 K-medoids 类似,Spectral Clustering 只需要数据之间的相似度矩阵就可以了,而不必像 K-means 那样要求数据必须是 N 维

漫谈 Clustering (4): Spectral Clustering<转载>

转自http://blog.pluskid.org/?p=287 如果说 K-means 和 GMM 这些聚类的方法是古代流行的算法的话,那么这次要讲的 Spectral Clustering 就可以算是现代流行的算法了,中文通常称为“谱聚类”.由于使用的矩阵的细微差别,谱聚类实际上可以说是一“类”算法. Spectral Clustering 和传统的聚类方法(例如 K-means)比起来有不少优点: 和 K-medoids 类似,Spectral Clustering 只需要数据之间的相似度

谱聚类(spectral clustering)原理总结

谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也不复杂.在处理实际的聚类问题时,个人认为谱聚类是应该首先考虑的几种算法之一.下面我们就对谱聚类的算法原理做一个总结. 一.谱聚类概述 谱聚类是从图论中演化出来的算法,后来在聚类中得到了广泛的应用.它的主要思想是把所有的数据看做空间中的点,这些点之间可以用边连接起来.距离较远的两个点之间的边权重值较低

谱聚类算法及其代码(Spectral Clustering)

简介 文章将介绍谱聚类(spectral clustering)的基本算法,以及在matlab下的代码实现.介绍内容将包括: 从图分割角度直观理解谱聚类 谱聚类算法步骤 数据以及实现代码 本文将不会涉及细节化的证明和推导,如有兴趣可参考july大神的文章从拉普拉斯矩阵说到谱聚类. 对谱聚类的理解 这一节将从图分割聚类的角度直观理解谱聚类.不过,因为本人是从事社交媒体分析的,将从一种社会关系网络的角度来介绍网络图分割成多个子图的概念. 图的分割 首先将社会关系网络看成是一个整体,每一个个体(use

谱聚类算法(Spectral Clustering)

谱聚类(Spectral Clustering, SC)是一种基于图论的聚类方法——将带权无向图划分为两个或两个以上的最优子图,使子图内部尽量相似,而子图间距离尽量距离较远,以达到常见的聚类的目的.其中的最优是指最优目标函数不同,可以是割边最小分割——如图1的Smallest cut(如后文的Min cut), 也可以是分割规模差不多且割边最小的分割——如图1的Best cut(如后文的Normalized cut). 图1 谱聚类无向图划分——Smallest cut和Best cut 这样,