GO/KEGG功能富集分析及气泡图

何为功能富集分析?

功能富集分析是将基因或者蛋白列表分成多个部分,即将一堆基因进行分类,而这里的分类标准往往是按照基因的功能来限定的。换句话说,就是把一个基因列表中,具有相似功能的基因放到一起,并和生物学表型关联起来。

何为GO和KEGG?

为了解决将基因按照功能进行分类的问题,科学家们开发了很多基因功能注释数据库,。这其中比较有名的一个就是Gene Ontology(基因本体论,GO)和Kyoto Encyclopedia of Genes and Genomes(京都基因与基因组百科全书,KEGG)。

其中,GO是基因本体论联合会建立的一个数据库,旨在建立一个适用于各种物种的、对基因和蛋白功能进行限定和描述的、并能够随着研究不断深入而更新的语义词汇标准。GO注释分为三大类:分子生物学功能(Molecular Function,MF)、生物学过程(Biological Process,BP)和细胞学组分(Cellular Components,CC),通过这三个功能大类,对一个基因的功能进行多方面的限定和描述。

而KEGG,大多数人会将其当做一个基因通路(Pathway)的数据库,其实KEGG的功能远不止于此。KEGG是一个整合了基因组、化学和系统功能信息的综合数据库。KEGG下属4个大类和17个子数据库,而其中有一个数据库叫做 KEGG Pathway,专门存储不同物种中基因通路的信息,也是用的最多的一个,久而久之,KEGG被大家当做一个通路数据库了。

下面两个图展示了GO和KEGG Pathway的面貌。

如何做功能富集分析?

做功能富集分析的算法有很多,能够做功能富集分析的工具也非常多,见下面的列表

Funrich 也可以做功能富集分析

以上的工具中,DAVID最为常用也最为权威。DAVID是由美国Leidos生物医学研究公司的LHRI团队开发的一个在线基因注释及功能富集网站(https://david.ncifcrf.gov/)

使用DAVID做功能富集分析

原文地址:https://www.cnblogs.com/0820LL/p/11656330.html

时间: 2024-07-30 10:39:28

GO/KEGG功能富集分析及气泡图的相关文章

【R】clusterProfiler的GO/KEGG富集分析用法小结

前言 关于clusterProfiler这个R包就不介绍了,网红教授宣传得很成功,功能也比较强大,主要是做GO和KEGG的功能富集及其可视化.简单总结下用法,以后用时可直接找来用. 首先考虑一个问题:clusterProfiler做GO和KEGG富集分析的注释信息来自哪里? GO的注释信息来自Bioconductor,提供了19个物种的org类型的GO注释信息,如下表所示.Bioconductor中更多的注释包可参考http://www.bioconductor.org/packages/rel

GSEA - Gene set enrichment analysis 基因集富集分析原理与应用

RNA-seq是利器,大部分做实验的老板手下都有大量转录组数据,所以RNA-seq的分析需求应该是很大的(大部分的生信从业人员应该都差不多要沾边吧). 普通的转录组套路并不多,差异表达基因.富集分析.WGCNA network以及一些没卵用的花式分析.DEG分析是基础,up and down,做个富集,了解一下处理后到底是什么通路被改变了:WGCNA主要就是根据相关性来找出一些co-express的gene module. 单细胞的转录组的玩法就比较多了,可以理解为超多样本的普通转录组,普通转录

功能点分析法FPA笔记

转载请注明出处:http://www.cnblogs.com/lidabnu/p/5700412.html 主要参考资料来自百度文库:http://wenku.baidu.com/link?url=yIlNC-mchaeBPtiz6zeXTMPQgIgY_1tyfb0rlJjvB43aqRNWZrcdfL13cL7pgfgWawJZ1Rq2ZDAsLs2IqaXNgfr5VEEWHUCvKt4xAJalXua 关键点: 功能点分析是一种从用户的角度对软件开发进行度量的方法. 目标: 功能点方法度

Pathway富集分析气泡图

data.tsv > pathway = read.table("data.tsv",header = T, sep="\t") > library(ggplot2) > p = ggplot(pathway,aes(Pvalue,Pathway)) > p=p + geom_point() > p=p + geom_point(aes(size=Count)) > pbubble = p+ geom_point(aes(size

Hadoop 3.0 Erasure Coding 纠删码功能预分析

前言 HDFS也可以支持Erasure Coding功能了,将会在Hadoop 3.0中发布,可以凭图为证: 在HDFS-7285中,实现了这个新功能.鉴于此功能还远没有到发布的阶段,可能后面此块相关的代码还会进行进一步的改造,因此只是做一个所谓的预分析,帮助大家提前了解Hadoop社区目前是如何实现这一功能的.本人之前也没有接触过Erasure Coding技术,中间过程也确实有些偶然,相信本文可以带给大家收获. 巧遇Hadoop 3.0 Erasure Coding 第一次主动去了解eras

深入解析物联网操作系统(架构/功能/实例分析)

?? 1.       物联网的主要特点 i.             连接 所谓连接,指的是各种各样的终端设备,都能够通过某种网络技术,连接到一个统一的网络上.任何终端之间都可以相互访问.下一代的基础通信网络,包括未来的5G,通信网络架构重构等,为物联网提供泛连接网络是核心目标.目前也已经有很多厂商推出解决方案,比如Google的thread/wave,华为的Hi-Link,以及NB-IoT等. 传统的物联网连接,都是指物联网终端设备与物联网云平台之间的连接,如下图: 在这种模式下,物联网设备

Ecshop的商品筛选功能实现分析之一(主要对category.php进行分析)

一.首先,说明一下为什么要对category.php文件进行分析. (1)原因如下: ①个人对商城类商品筛选功能的实现比较好奇: ②对商城中关于商品的数据表设计比较感兴趣.(该功能涉及到与数据库的交互,而且与数据库中数据表的设计好坏有一定的联系): ③多条件(属性)筛选功能在现今的很多网站都需要用到,很广泛(如:一般商城网.团购网.房产网.信息分类网站等等). (2)希望达到的目的是: ①能够对多条件筛选功能有一个初步的认识.(起码自己做,也能够快速实现吧): ②对多条件筛选的实现中,数据库该如

深圳合众致达~~~无线远传预付费水表的功能简要分析

kpi    :   http://hzzdon.zjtech.cc/index.html 1.存储功能:无线远传预付费水表的累计用水量和月用水量能够准确保存在EEPROM中,掉电数据不丢失. 2.实时时钟功能:无线远传水表能够自动记录时钟,并能够计算日历. 3.冻结功能:无线远传水表能够在每个自然月末自动冻结本月的累计用水量数据,最多可以冻结12个月的用水量. 4.电池检测功能:无线远传水表每12天自动检测电池电压一次,如果为高表示电池电压正常,如果为低则设置换电池标志.(在设置换电池标志后,

书店网站数据表及各个功能的分析

---恢复内容开始--- 1).登陆时的[记住我]怎么实现? 1.在[cookie]中只放[用户名]----已知Cookie在本地的临时文件夹存在,假如已知一个论坛的登录名是“admin”,我就可以在我的本地伪造一个Cookie,这样登陆后台时,就会被系统误认为,已经登陆过,导致BUG产生. 2.在[Cookie]中存放[用户名和密码]----黑客入侵,就可以通过Cookie破解出我的密码,不安全~~! 3.在[Cookie]中存放[用户名和GUID]-----可以 4.在[Cookie]中存放