PPI | protein-protein interaction | 蛋白互作分析 | gene interaction | 基因互作

前言

做RNA-seq基因表达数据分析挖掘,我们感兴趣的其实是“基因互作”,哪些基因影响了我们这个基因G,我们的基因G又会去影响哪些基因,从而得到基因调控的机制。

直觉确实是很明确的,但是细节处却有很多问题。

我们讨论的到底是基因表达的互作,还是基因产物的互作?

------------

对于蛋白编码基因,它翻译产生蛋白,如果此蛋白不参与转录过程,理论上不可能会影响另一个基因的表达,那也就不存在基因表达的互作的,它们的基因表达被很好的隔离起来了,相互独立,互不影响。

但现在鉴定出了很多调控基因或其他在基因组上的调控序列,比如miRNA、lncRNA等,它们也都需要从基因组上转录出来,然后转录产物会去影响其他基因的表达(影响转录)。这才是基因表达互作,虽然MiRNA、lncRNA不能被称作基因。

------------

基因产物的互作就普遍了,那就是蛋白互作,也就是STRING等数据库里收集的信息。

蛋白互作也容易直观理解些,复杂的多细胞生命体,几乎所有的功能都是靠蛋白来实现的,所以有很多蛋白要互相结合(空间上)在一起来行使自己的功能。

------------

还有一个就是遗传学领域的基因互作,这与生物学的基因互作完全不同,遗传学考虑的是宏观的基因互作,站在表型的基础上。 Novel phenotypes often result from the interactions of two genes。

遗传学的基因互作是生物学基因产物互作的结果。

Defining genetic interaction

GENE INTERACTIONS



STRING database的挖掘

这个数据库绝对是做实验人的宝藏,里面包含了各种蛋白互作关系,不用做实验就有一大堆证据。

IPA了解一下,收费的高端分析软件,大部分就是整合的这个数据库,很多大佬喜欢用IPA来找明星基因,再来讲故事,实例请看之前解读的CSC paper。

首先了解一下STRING里面有哪些文件可以下载:

https://string-db.org/cgi/download.pl?sessionId=yMNmD7s36wS8

选你的物种,减少文件大小,常用的就是互作数据:

一般我们想知道某个蛋白会与哪些其他蛋白互作,以及互作的类型,然后做下游分析,信息都在这几个文件里了。

注:有哪些互作关系需要好好搞清楚,移步help,https://string-db.org/cgi/help.pl?sessionId=yMNmD7s36wS8

Docs » User documentation » Getting started » Evidence

Conserved Neighborhood
Co-occurrence
Fusion
Co-expression
Experiments
Databases
Text mining

每一个PPI关系的证据来源是不同的,选择你需要的证据。我觉得里面最可靠的就是Experiments, Databases和Text mining了。

当然,我们是高手,能用更简单的方法绝不用复杂的,那么STRING的API了解一下。

用任意脚本语言读以下格式化地址:

https://string-db.org/api/[output-format]/interaction_partners?identifiers=[your_identifiers]&[optional_parameters]

就能得到一个dataframe结果,不用下载,不用筛选,速度更快,随调随用。

实例,我想知道HDAC4的互作蛋白,可以这么抓:

老鼠:Mus%20musculus

url <- "https://string-db.org/api/tsv/interaction_partners?identifiers=HDAC4&species=Homo%20sapiens"
webDf <- read.table(url, header=T)
head(webDf)

       stringId_A      stringId_B preferredName_A preferredName_B ncbiTaxonId score
1 ENSP00000264606 ENSP00000080059           HDAC4           HDAC7        9606 0.934
2 ENSP00000264606 ENSP00000202967           HDAC4           SIRT4        9606 0.809
3 ENSP00000264606 ENSP00000209873           HDAC4            AAAS        9606 0.901
4 ENSP00000264606 ENSP00000209875           HDAC4            CBX5        9606 0.779
5 ENSP00000264606 ENSP00000212015           HDAC4           SIRT1        9606 0.988
6 ENSP00000264606 ENSP00000215832           HDAC4           MAPK1        9606 0.572
  nscore fscore pscore ascore escore dscore   tscore
1      0      0      0  0.061  0.320   0.90 0.061985
2      0      0      0  0.052  0.166   0.00 0.778000
3      0      0      0  0.058  0.000   0.90 0.000000
4      0      0      0  0.062  0.463   0.54 0.159000
5      0      0      0  0.052  0.415   0.90 0.812000
6      0      0      0  0.000  0.433   0.00 0.276000  

结果解读:

Output fields (TSV and JSON formats):

Field Description
stringId_A STRING identifier (protein A)
stringId_B STRING identifier (protein B)
preferredName_A common protein name (protein A)
preferredName_B common protein name (protein B)
ncbiTaxonId NCBI taxon identifier
score combined score
nscore gene neighborhood score
fscore gene fusion score
pscore phylogenetic profile score
ascore coexpression score
escore experimental score
dscore database score
tscore textmining score

抓其他信息改下API就行了

还有很多工具是基于STRING做富集分析的,也可以了解一下,主要看自己需求。

待续~

原文地址:https://www.cnblogs.com/leezx/p/10718486.html

时间: 2024-11-10 16:51:14

PPI | protein-protein interaction | 蛋白互作分析 | gene interaction | 基因互作的相关文章

AI实例教程0001-制作车轮&0002-卡通小人&0003-制作卡通小鸭子

1.制作车轮 主要通过椭圆工具.矩形工具.透明度浮动面板.渐变浮动面板完成设计任务. 腾讯视频观看地址:https://v.qq.com/x/page/k0396dxwznb.html 2.制作卡通小人 练习椭圆工具.柜形工具.自由变换工具.钢笔工具.内部绘图.颜色浮动面板.透明度浮动面板.渐变浮动面板,全面掌握相关工具.浮动面板的使用方法. 腾讯视频观看地址:https://v.qq.com/x/page/k0396k0vrab.html 3.制作卡通小鸭子 对颜色浮动面板.钢笔工具.矩形工具

dedecms5.7添加栏目时以简拼作目录名 以拼音首字母作文件夹名称

今天分享DedeCMS添加栏目的一个小技巧,添加栏目以简拼作目录名,以拼音首字母作文件夹名称,默认情况情况下,DedeCMS添加栏目时是以全拼作为文件夹名称,后台也没有提公简拼的选项,但是我们可以通过修改源码的方式实现.因为DedeCMS在获取栏目目录名的时候,是利用的string助手的一个GetPinyin方法,具体这个方法可以见:http://www.heliweb.net/PHPDOC/DedeCMS-Helpers/_include---helpers---string.helper.p

锥爪走佐滋作锥爪走佐滋作ldhupu锥爪走佐滋作

昨组柞孜棕祖祝自宗锥坠桩锥足篆综揍综字坐昨组妆准醉着琢砖足庄爪桌桩纵籽撰姿拽兹缀踪做赚自谞灼赘组综渍棕咨组撰壮拙孜状仔走字走锥资罪琢昨揍宗揍转孜准钻诅最着酌诅谞族椎租佐作左抓篆拽渍拙纵滓桩昨琢姿总邹拙注座装诅砖棕尊驻酌昨尊足咨酌渍浊缀资罪赘柞赘着拽紫组状渍琢琢紫座孜篆诅宗啄赚砖桩纂赘走自赚纂纂谞纵抓纂椎仔抓灼昨着做拙总柞锥专奏祝滋撰鬃棕篆拽状宗卒酌祝壮拙赚综驻作拽自椎租祝壮赚醉啄撰鬃拽驻滓姿坠拙壮庄浊姿坠足综撰棕专邹篆灼谆姿祖纂资拽罪注字组自滋阻宗注紫卒钻滓座兹族柞卓祝椎祝昨庄总紫桌拙最拽 赚琢

尊左座作浊注尊左座作浊注blivhv尊左座作浊注

壮租佐纵琢揍钻揍茁紫妆字拽邹装浊灼茁转组昨撞谞准妆缀缀赚做自尊拽砖滋资族专踪遵抓踪座撰诅仔妆驻揍最拽左走桌渍祖妆坐诅锥最昨撞紫奏总灼纵抓浊昨赚妆族爪滋左兹渍兹综宗驻庄淄准总租阻祖资昨足奏滓撞灼壮奏砖作妆撞滓谞抓遵钻酌自滓灼赚注浊啄棕滓专罪抓尊滋组桩赚谆作篆谞淄赘尊赚装妆浊阻宗总字揍足座爪谆着赚咨遵仔追最自住姿紫做专醉族捉柞走锥抓滋拽桌赘资籽作总阻妆琢租转昨浊专棕遵篆篆装浊锥做自罪壮咨撞柞浊揍祖椎走租紫坐遵装茁驻左踪奏追佐佐祝纂诅嘴篆椎揍佐灼拽琢纵浊仔醉佐揍奏琢淄做孜诅驻桩字综追琢奏茁撞浊砖走座拽

JSONUtil(JAVA对象/List与json互转,xml与json互转)

package com.chauvet.utils.json; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.FileWriter; import java.io.InputStreamReader; import java.util.List; import net.sf.json.JSONArray; import net.sf.json.J

hbase针对fullgc所做的优化(Memstore所作的优化 针对BlockCache所作优化)

先看:深入研究java gc https://blog.51cto.com/12445535/2372976老年代 CMS gc回收算法 对hbase的影响 https://blog.51cto.com/12445535/2373206 1.最原始的HBase CMS GC相当严重,经常会因为碎片过多导致Promotion Failure,严重影响业务的读写请求.2.分别是针对Memstore所作的两个优化:Thread-Local Allocation Buffer和MemStore Chun

JsonObject与javabean互转,Map与javabean互转

/** * 将Json对象转换成Map * * @param jsonObject * json对象 * @return Map对象 * @throws JSONException */ public static Map toMap(String jsonString) throws JSONException { JSONObject jsonObject = new JSONObject(jsonString); Map result = new HashMap(); Iterator i

撰淄壮作走啄撰淄壮作走啄hpvvug撰淄壮作走啄

http://www.orion34g.com/html/3/3677/14758191.html http://www.orion34g.com/html/3/3677/14758204.html http://www.orion34g.com/html/3/3677/14758205.html http://www.orion34g.com/html/3/3677/14758206.html http://www.orion34g.com/html/3/3677/14758207.html

妆作族灼柞最妆作族灼柞最jbjhbsjbjhbs

nvafnnnvafnnnvafnn足茁注佐啄准足茁注佐啄准足茁注佐啄准足茁注佐啄准足茁注佐啄准足茁注佐啄准足茁注佐啄准 http://www.bxwx.cc/91/91516/16720336.html http://www.bxwx.cc/91/91516/16720339.html http://www.bxwx.cc/91/91516/16720340.html http://www.bxwx.cc/91/91516/16720343.html http://www.bxwx.cc/91