用TCGA收集的mRNA表达数据作差异表达

做差异表达的软件DEseq和edgeR所需要的数据格式必须是原始counts,经过normalization和log2后的数据都不适合,所以对于做差异表达计算的童鞋可以使用
ExperimentHub下载TCGA的原始数据。

GEO地址:http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE62944
安装:
首先安装环境要求BioC 3.4
## In R-3.3
library(BiocInstaller)
useDevel()
biocValid() # checks for out of date packages
biocLite() # (optional) updates out of date packages

升级到3.4后可以安装expermentHub
source("https://bioconductor.org/biocLite.R")
biocLite("ExpermentHub")
测试运行OK。

library(ExperimentHub)
eh = ExperimentHub()
query(eh , "GSE62944")
tcga_data <- eh[["EH1"]]

head(phenoData(tcga_data)$CancerType)

时间: 2024-10-29 20:29:37

用TCGA收集的mRNA表达数据作差异表达的相关文章

从Apache的日志文件收集和提供统计数据(一个Python插件架构的简单实现)

从Apache的日志文件收集和提供统计数据 这一章我们将介绍基于插件程序的架构和实现.作为例子,我们将构建一个分析Apache服务器log文件的框架.这一次我们不再使用单片机的方式来创建,而是改为采用模块化的方式.一旦我们有了一个基本框架,我们就可以为它创建一个插件.这个插件可以基于请求者的地理位置执行分析. 程序的结构和功能 在数据维护和统计收集领域,很难有一个单一的应用程序可以适合多个用户的需求.让我们以分析Apache的web服务器日志文件为例.web服务器接受到的每一个请求都被记录在日志

单细胞测序数据的差异表达分析方法总结

无论是传统的多细胞转录组测序(bulk RNA-seq)还是单细胞转录组测序(scRNA-seq),差异表达分析(differential expression analysis)是比较两组不同样本基因表达异同的基本方法,可获得一组样本相对于另一组样本表达显著上调(up-regulated)和下调的基因(down-regulated),从而可进一步研究这些差异表达基因的功能,包括富集的通路(pathway)或生物学过程(biological process). 由于单细胞测序技术的局限性,单细胞

SQL Server自动化运维系列——关于数据收集(多服务器数据收集和性能监控)

需求描述 在生产环境中,很多情况下需要采集数据,用以定位问题或者形成基线. 关于SQL Server中的数据采集有着很多种的解决思路,可以采用Trace.Profile.SQLdiag.扩展事件等诸多方案. 几种方案各有利弊,其中从SQL Server2012版本开始,微软的开始各种整合这些采集方案,力推扩展事件. 对于上述的数据采集只是一种实现手段,对于采集完数据的存储没有统一的规范,并且对于多服务器的数据采集及汇总没形成统一的规范. 本篇实现 1.通过SQL Server自带的数据采集器实现

如何用 Python 和 API 收集与分析网络数据?

摘自 https://www.jianshu.com/p/d52020f0c247 本文以一款阿里云市场历史天气查询产品为例,为你逐步介绍如何用 Python 调用 API 收集.分析与可视化数据.希望你举一反三,轻松应对今后的 API 数据收集与分析任务. 市场 我们尝试的,是他们找到的阿里云市场的一款 API 产品,提供天气数据. 它来自于易源数据,链接在 https://market.aliyun.com/products/57096001/cmapi010812.html?spm=517

日志收集之--将Kafka数据导入Elastic

最近需要搭建一套日志监控平台,结合系统本身的特性总结一句话也就是:需要将Kafka中的数据导入到elasticsearch中.那么如何将Kafka中的数据导入到elasticsearch中去呢,总结起来大概有如下几种方式: Kafka->logstash->elasticsearch->kibana(简单,只需启动一个代理程序) Kafka->kafka-connect-elasticsearch->elasticsearch->kibana(与confluent绑定紧

函数来表达数据

函数和数据在一般语言里严格区分,函数的限制非常多,仅作为接受数据来处理的工厂,而在函数式语言中,函数是first-class,拥有很大的自由性和表达力. 比如,它让你重新思考什么是0,什么是1,它可以让你来定义0和1,比如这样: 这是0 (define zero (lambda (f) (lambda (x) x))) 这是1 (define one ( lambda (f) (lambda (x) (f x)))) 这是2 (define two (lambda (f) (lambda (x)

大数据作军师,百度糯米的双12技术秀

随着电子商务与O2O在国内的蓬勃发展,中国人的节日就越来越多了.不论是3·7女生节,还是5·17吃货节,亦或是电商盛会的双11,各大电商以及O2O平台在节日里都卯足劲要大干一场.而在今天的双十二大战中,百度糯米.新美大.口碑网这三大生活类O2O平台的战争也颇为精彩. 过去我们论起团购三强,指的是美团.大众点评.百多糯米这三强.不过美团大众点评合并之后,格局就发生变化了.如果从市场份额来看,是新美大与百度糯米的南北对峙,口碑几乎可以忽略不计:从综合实力来看,今年6月才重启的阿里口碑,与前两名新美大

Python爬虫收集今日热榜数据:聚合全网热点排行榜

主要使用request库和beautifulSoup库爬取今日热榜的数据. 具体代码实现: 1 import requests 2 from bs4 import BeautifulSoup 3 import time 4 import pandas 5 import re 6 7 def get_html(url): 8 headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36

ajax 提交表达数据到后台

今天用了差不多一天的时间做了表单的取值并且保存到数据库,显示出来,算是自己的一个小小的进步吧,笔记下来,多看看. 是类似于发布留言功能: 前台代码: <div id="dialog" class="animated"> <img class="dialogIco" width="50" height="50" src="/images/ico.png" /> &l