ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)

文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)

期刊名:Mol Cell Proteomics

发表时间:(2019年11月)

IF4.828

单位:南丹麦大学生物化学与分子生物学系和VILLUM生物分析科学中心

物种:人和小鼠

技术:ComplexBrowser

 

一、 概述:(用精炼的语言描述文章的整体思路及结果)

ComplexBrowser软件在CORUM和EBI两个测试数据集中识别了在人癌症和小鼠T细胞活化过程中已知的受调控的关键蛋白质复合物。找到了给定蛋白质列表中存在的已知蛋白质复合物,并利用定量蛋白质组数据(无标签或等分质量标签)和因子分析来总结整体研究生物条件中每个复合物的表达趋势。通过蛋白质复合物的鉴定而实现的生物学解释与基于原始研究中的GO注释得出的结论一致。该工具还对以前未在分析中考虑的带注释的蛋白质复合物进行研究,增加了新的见解。对这两个先前公布的大规模蛋白质组数据集的重新分析表明,该方法在不同生物环境中深入了解蛋白质复合物的调控具有巨大潜力。

二、 研究背景:(简要介绍研究进展动态、研究目的和意义)

蛋白质复合物是分子机器,可以执行许多重要的细胞生化关键活动,例如:复制,转录,翻译,细胞信号转导,细胞周期调控和氧化磷酸化。它们在维持细胞稳态和参与疾病发展中的作用证明了蛋白复合物表达的详细表征将有助于理解细胞中通常高度交织的过程。许多已知的蛋白质复合物是翻译和翻译后调节的,因此在细胞类型和组织之间比较时表现出共表达。然而,到目前为止,还没有开发用于分析新数据集中复杂行为的自动化和用户友好型方法。

ComplexBrowser软件可以提供蛋白质复合物表达和组成成分的交互可视化信息,以进行探索性分析,并结合了质量控制步骤,其中包括基于limma软件包的标准化和统计分析。是第一个用于自动化定量蛋白质复合物分析以进行高通量研究的工具,具有集成到科学界常用的数据分析工作流中的巨大潜力。

三、实验设计:

四、研究成果:

1、腺癌数据集使用基于LFQ强度的无标记定量方法研究了结肠癌患者健康结肠黏膜和淋巴结转移性肿瘤的福尔马林固定的石蜡包埋组织样品的蛋白表达差异。该程序的一般分析流程如图1所示。在定义分析参数(例如条件数量和重复项)后,将对数据质量进行分析并可视化。在接下来的窗口中,进行蛋白质复合物的存在和丰度变化的分析。交互式表格和图形使用户可以方便地评估分析结果。鉴定出的蛋白质列表以及定量信息将上传至软件,并设置分析参数(左图)。接下来是对所提供定量数据质量的评估(中间图)。最后,鉴定并可视化蛋白质复合物的存在和丰度变化(右图)。

2、将含有3种生物学条件,7个重复的定量蛋白质组学值的腺癌数据集数据按顺序上传到ComplexBrowser:C1 –对照,C2 –转移,C3 –癌症。对数转换强度的箱线图分析(图2A)表明,归一化对于减小强度分布之间的差异并确保样品之间的可比性是必要的;因此,进行了分位数归一化。图2B表明尽管进行了标准化,但对照,转移和癌症样品的平均CV值分别为65%,78%和77%,测量范围内的变化较大,很可能是由于样品的临床特征导致。图2C表明在腺癌数据集中,每个样品的缺失值数量从113到510不等,共占所有有效测量值的3.5%,没有显示出持久的数据偏差。PCA分析(图2D)显示对照样品良好分离,但癌与转移组织之间存在重叠。

3、T细胞数据集由四组(0、2、8和16 h)组成,具有两个重复,基于TMT的定量方法生成。ComplexBrowser生成的T细胞数据集质量控制分析可视化图3A显示出了所选样品之间蛋白质与TMT强度的相关性。越来越多的差异表达蛋白质(39、1,869和5,600)在2、4和16小时后检测到。图3B展示了由ComplexBrowser软件生成的火山图,C1,C2,C3和C4分别表示未受刺激的T细胞(0小时)和分别受刺激2小时,8小时和16小时的T细胞。

4、用CORUM和Complex Portal分析腺癌数据集的蛋白质复合物,分别鉴定了1,519和366个蛋白质复合物。图4给出了由ComplexBrowser生成的蛋白质复合物及其成分的典型可视化图。A-代表复合物组成成分在转移和对照样品之间变化的星形图,B图表示NADH泛醌氧化还原酶链6(P03923)的表达在癌症和转移组织中的表达降低,C图为呼吸链复合体I中所鉴定及定量的蛋白亚基的表达谱,D图表示三种分析条件下呼吸链复合体I中已识别和量化的蛋白亚基的对数转换后的平均归一化强度的相关热图,E图表示A组中呈现的呼吸链复合体I中已识别和量化的蛋白亚基的对数转换后的平均归一化强度热图; C1 –正常,C2 –癌症,C3 –转移组织。

5、图5显示了ComplexBrowser对T细胞数据集中的选定蛋白质复合物进行鉴定后的结果。发现p19-Cdk4-cyclinD2(16小时后为3.96 CFC)和与Cyclin D1相关的蛋白复合物(16小时后为2.47 CFC)是激活后8和16小时内上调程度最高的蛋白。这两个复合物参与细胞周期的调节和通过G1期的转变,它们的协同上调反映了T细胞向增殖状态的转变。这些变化伴随着各种DNA聚合酶复合物,例如DNA聚合酶表达的增加。此外,在Cd3d-Cd3g-Cd3e-Cd247复合物(1.07,-1.2,-1.36 CFC)的表达中发现了下调趋势,该复合物是T细胞共受体的一部分,其在T细胞激活期间被关闭。

五、文章亮点(结论讨论):

ComplexBrowser是第一个能够对蛋白质组学实验中的蛋白质复合物进行定量分析的自动化工具。它可以通过网络浏览器获得,不需要任何安装或编程经验。

该软件的独特功能是能够量化蛋白质复合物的丰度变化以及不同实验条件下的组成成分共表达。ComplexBrowser可以处理包含8,000多种定量蛋白质的大型蛋白质组学研究,并能够在输入数据后一分钟内显示汇总结果。交互式可视化为探索性分析和数据解释提供了直观的工具,使用户能够研究整个复合物以及单个亚基的行为。CFC(Complex fold change复合物的倍数变化)有效地帮助找到以同步方式变化表达的复合物,并且是复杂行为的一种度量。使用软件中实现的大量可视化工具,还可以轻松识别与复杂表达趋势不一致的亚基。

ComplexBrowser中呈现的方法的新颖之处在于,与GO注释和GO富集分析相比,ComplexBrowser可从手动管理的数据库(例如,数据库)中识别蛋白质复合物的成分,在其他任何软件中均不提供,它有助于蛋白质组学数据的定量分析,这是快速应用程序-FARMS算法,用于以CFC因子的形式定量测量复杂组件的变化,并以噪声的形式评估复杂亚基的协调表达。因此,ComplexBrowser为例如STRING或GO术语富集工具提供了一种补充方法。目前,ComplexBrowser最适合分析人类蛋白质。此外,数据库包含未完全注释的条目。数据库的进一步开发将改善软件提供的结果。

阅读人:张霞

原文地址:https://www.cnblogs.com/ilifeiscience/p/12015783.html

时间: 2024-07-31 15:00:27

ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)的相关文章

IT英语4-计算机英语缩写术语

1.CPU 3DNow!(3D no waiting,无须等待的3D处理) AAM(AMD Analyst Meeting,AMD分析家会议) ABP(Advanced Branch Prediction,高级分支预测) ACG(Aggressive Clock Gating,主动时钟选择) AIS(Alternate Instruction Set,交替指令集) ALAT(advanced load table,高级载入表) ALU(Arithmetic Logic Unit,算术逻辑单元) 

Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning (解读人:闫克强)

文献名:Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning(利用质谱技术和机器学习模型在尿液样本中快速准确地进行菌种鉴定) doi: 10.1074/mcp.TIR119.001559 期刊名:Mol Cell Proteomics 作者:Florence Roux-Dalvai 通讯作者:Arnaud

Method and apparatus for encoding data to be self-describing by storing tag records describing said data terminated by a self-referential record

A computer-implemented method and apparatus in a computer system of processing data generated by a first application program in a second application program during runtime. During runtime, the first application program generates a record including a

Tcpdump用法

1.监听所有非echo requests/replies的ICMP数据包 //ICMP ECHO(Type 8) 和ECHO Reply (Type 0) #tcpdump "icmp[0] != 8 and icmp[0] != 0" 2.监听非本地网络的每次TCP会话开始和结束数据包 #tcpdump 'tcp[13] & 3 != 0 and not src and dst net localnet' 3.监听网关snup上长度大于576字节的IP数据包 #tcpdump

常用图像数据集大全

1.搜狗实验室数据集: http://www.sogou.com/labs/dl/p.html 互联网图片库来自sogou图片搜索所索引的部分数据.其中收集了包括人物.动物.建筑.机械.风景.运动等类别,总数高达2,836,535张图片.对于每张图片,数据集中给出了图片的原图.缩略图.所在网页以及所在网页中的相关文本.200多G 2 http://www.imageclef.org/ IMAGECLEF致力于位图片相关领域提供一个基准(检索.分类.标注等等) Cross Language Eva

[it-ebooks]电子书列表

#### it-ebooks电子书质量不错,但搜索功能不是很好 #### 格式说明  [ ]中为年份      ||  前后是标题和副标题  #### [2014]: Learning Objective-C by Developing iPhone Games || Leverage Xcode and Objective-C to develop iPhone games http://it-ebooks.info/book/3544/ Learning Web App Developmen

图像处理与机器视觉行业分析

图像处理与机器视觉 一 行业分析 数字图像处理是对图像进行分析.加工.和处理,使其满足视觉.心理以及其他要求的技术.图像处理是信号处理在图像域上的一个应用.目前大多数的图像是以数字形式 存储,因而图像处理很多情况下指数字图像处理.此外,基于光学理论的处理方法依然占有重要的地位. 数字图像处理是信号处理的子类, 另外与计算机科学.人工智能等领域也有密切的关系. 传统的一维信号处理的方法和概念很多仍然可以直接应用在图像处理上,比如降噪.量化等.然而,图像属于二维信号,和一维信号相比,它有自己特殊的一

【深度学习Deep Learning】资料大全

转载:http://www.cnblogs.com/charlotte77/p/5485438.html 最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books Deep Learning66 by Yoshua Bengio, Ian Goodfellow and Aaron Courville Neural Networks and Deep Learning42 by Michael Nielsen Deep Learning27 by

paper 15 :整理的CV代码合集

这篇blog,原来是西弗吉利亚大学的Li xin整理的,CV代码相当的全,不知道要经过多长时间的积累才会有这么丰富的资源,在此谢谢LI Xin .我现在分享给大家,希望可以共同进步!还有,我需要说一下,不管你的理论有多么漂亮,不管你有多聪明,如果没有实验来证明,那么都是错误的.  OK~本博文未经允许,禁止转载哦!  By  wei shen Reproducible Research in Computational Science “It doesn't matter how beautif