用TCGA收集的mRNA表达数据作差异表达

做差异表达的软件DEseq和edgeR所需要的数据格式必须是原始counts,经过normalization和log2后的数据都不适合，所以对于做差异表达计算的童鞋可以使用
ExperimentHub下载TCGA的原始数据。

GEO地址：http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE62944
安装：
首先安装环境要求BioC 3.4
## In R-3.3
library(BiocInstaller)
useDevel()
biocValid() # checks for out of date packages
biocLite() # (optional) updates out of date packages

升级到3.4后可以安装expermentHub
source("https://bioconductor.org/biocLite.R")
biocLite("ExpermentHub")
测试运行OK。

library(ExperimentHub)
eh = ExperimentHub()
query(eh , "GSE62944")
tcga_data <- eh[["EH1"]]

head(phenoData(tcga_data)$CancerType)

时间： 2024-10-29 20:29:37

用TCGA收集的mRNA表达数据作差异表达的相关文章

从Apache的日志文件收集和提供统计数据（一个Python插件架构的简单实现）

从Apache的日志文件收集和提供统计数据这一章我们将介绍基于插件程序的架构和实现.作为例子,我们将构建一个分析Apache服务器log文件的框架.这一次我们不再使用单片机的方式来创建,而是改为采用模块化的方式.一旦我们有了一个基本框架,我们就可以为它创建一个插件.这个插件可以基于请求者的地理位置执行分析. 程序的结构和功能在数据维护和统计收集领域,很难有一个单一的应用程序可以适合多个用户的需求.让我们以分析Apache的web服务器日志文件为例.web服务器接受到的每一个请求都被记录在日志

单细胞测序数据的差异表达分析方法总结

无论是传统的多细胞转录组测序(bulk RNA-seq)还是单细胞转录组测序(scRNA-seq),差异表达分析(differential expression analysis)是比较两组不同样本基因表达异同的基本方法,可获得一组样本相对于另一组样本表达显著上调(up-regulated)和下调的基因(down-regulated),从而可进一步研究这些差异表达基因的功能,包括富集的通路(pathway)或生物学过程(biological process). 由于单细胞测序技术的局限性,单细胞

SQL Server自动化运维系列——关于数据收集（多服务器数据收集和性能监控）

需求描述在生产环境中,很多情况下需要采集数据,用以定位问题或者形成基线. 关于SQL Server中的数据采集有着很多种的解决思路,可以采用Trace.Profile.SQLdiag.扩展事件等诸多方案. 几种方案各有利弊,其中从SQL Server2012版本开始,微软的开始各种整合这些采集方案,力推扩展事件. 对于上述的数据采集只是一种实现手段,对于采集完数据的存储没有统一的规范,并且对于多服务器的数据采集及汇总没形成统一的规范. 本篇实现 1.通过SQL Server自带的数据采集器实现

如何用 Python 和 API 收集与分析网络数据？

摘自 https://www.jianshu.com/p/d52020f0c247 本文以一款阿里云市场历史天气查询产品为例,为你逐步介绍如何用 Python 调用 API 收集.分析与可视化数据.希望你举一反三,轻松应对今后的 API 数据收集与分析任务. 市场我们尝试的,是他们找到的阿里云市场的一款 API 产品,提供天气数据. 它来自于易源数据,链接在 https://market.aliyun.com/products/57096001/cmapi010812.html?spm=517

日志收集之--将Kafka数据导入Elastic

最近需要搭建一套日志监控平台,结合系统本身的特性总结一句话也就是:需要将Kafka中的数据导入到elasticsearch中.那么如何将Kafka中的数据导入到elasticsearch中去呢,总结起来大概有如下几种方式: Kafka->logstash->elasticsearch->kibana(简单,只需启动一个代理程序) Kafka->kafka-connect-elasticsearch->elasticsearch->kibana(与confluent绑定紧

函数来表达数据

函数和数据在一般语言里严格区分,函数的限制非常多,仅作为接受数据来处理的工厂,而在函数式语言中,函数是first-class,拥有很大的自由性和表达力. 比如,它让你重新思考什么是0,什么是1,它可以让你来定义0和1,比如这样: 这是0 (define zero (lambda (f) (lambda (x) x))) 这是1 (define one ( lambda (f) (lambda (x) (f x)))) 这是2 (define two (lambda (f) (lambda (x)

大数据作军师，百度糯米的双12技术秀

随着电子商务与O2O在国内的蓬勃发展,中国人的节日就越来越多了.不论是3·7女生节,还是5·17吃货节,亦或是电商盛会的双11,各大电商以及O2O平台在节日里都卯足劲要大干一场.而在今天的双十二大战中,百度糯米.新美大.口碑网这三大生活类O2O平台的战争也颇为精彩. 过去我们论起团购三强,指的是美团.大众点评.百多糯米这三强.不过美团大众点评合并之后,格局就发生变化了.如果从市场份额来看,是新美大与百度糯米的南北对峙,口碑几乎可以忽略不计:从综合实力来看,今年6月才重启的阿里口碑,与前两名新美大

Python爬虫收集今日热榜数据：聚合全网热点排行榜

主要使用request库和beautifulSoup库爬取今日热榜的数据. 具体代码实现: 1 import requests 2 from bs4 import BeautifulSoup 3 import time 4 import pandas 5 import re 6 7 def get_html(url): 8 headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36

ajax 提交表达数据到后台

今天用了差不多一天的时间做了表单的取值并且保存到数据库,显示出来,算是自己的一个小小的进步吧,笔记下来,多看看. 是类似于发布留言功能: 前台代码: <div id="dialog" class="animated"> <img class="dialogIco" width="50" height="50" src="/images/ico.png" /> &l

猜你喜欢

2016.11.8与70大神联考的GG蒟蒻

第一题: 题意:大概是说有很多组数据,每组有n个字符串,这些字符串随便你翻转几次前2*v个字母,然后某次翻转后与另一字符串相同,则两个消去,问最后剩几个. 题解:挨着的两个字母为一组排序,然后比较,完 ...

JavaOne 2016——观众得以一睹JShell的威力

导读在JavaOne 2016的主题演讲中,Java平台组的首席架构师Mark Reinhold指出Java 9并不仅仅是Jigsaw,针对Java 9,一共包含了85个JEP.我在这里会关注一个他 ...

111111111111111111111111

{ "caret_style": "phase", "color_scheme": "Packages/Theme - Nexus ...

typedef 类型重命名和 #define 宏定义(1)

http://www.blogjava.net/jasmine214--love/archive/2010/11/29/339307.html 在现实生活中,信息的概念可能是长度,数量和面积等.在C语 ...

python学习之--自定义函数：

Python之--自定义函数: 在Python中,定义一个函数要使用def语句,依次写出函数名.括号.括号中的参数和冒号:,然后,在缩进块中编写函数体,函数的返回值用return语句返回. 以下自定义 ...

2014—暑期学习总结

每次进行阶段总结的时候,都会感叹时间过的好快.但在感叹时间飞逝的快的同时,有没有问自己时间管理是否做的到位?效率是否跟了上来?有没有想过在有限的时间里去尽可能做无线多的事情? 整体而言,这个暑假我对 ...

Python笔记4_字典学习

#dict:字典以"{}"包围的以"键:值"数据集合 # 成员之间用","分隔 # 可包含任何数据类型,包括列表 # 无序,数据项可改变 # ...

bash shell的基础特性之一

一.命令历史 bash会记录此前用户在shell会话中执行的命令于缓冲区中:正常退出时,会被记录于当前用户家目录下隐藏文件.bash_history中: 环境变量: HISTSIZE:命令历史记录的条 ...

一个简单的数据增量更新策略（Android / MongoDB / Django)

我在做个人APP - CayKANJI - 的时候遇到一个问题: 怎样增量式地把日语汉字数据地从服务器更新到APP端,即每次用户执行更新操作时,只获取版本高于本地缓存的内容. 数据格式为了能够与mo ...

VS2015连接Oracle数据库（转）

原文地址:https://xuanwo.org/2016/01/03/vs-oracle-11g 开发环境宿主机:Win10 + VS2015 + ODP.Net for VS2015虚拟机:Win ...

回首2014 展望2015

时间飞逝,真的很快,不知不觉一年已经过去,马上迎来2015年... 在2014年发生了很多很多事情, 这一年也成长了很多很多. ?兼职痛苦 2014年刚开始工作, 压力非常大, 不论是生活还是工作. ...

数据结构与算法分析 in C语言

p101提到磁盘区块大小的范围[32, 256],但 http://pclt.sites.yale.edu/blog/2010/03/10/disk-block-size 提到因为有读写的最小单位(5 ...

java 内存映射文件

内存映射文件提供了Java有可能达到的最快IO操作,故高性能Java应用应使用“内存映射文件”来持久化数据,尤其是对于较大文件来说它确实比I/O流要快很多,但是小文件却未必. 内存映射文件可以加载大文 ...

Hive之简单查询不启用MapReduce

假设你想查询某个表的某一列.Hive默认是会启用MapReduce Job来完毕这个任务,例如以下: 01 hive> SELECT id, money FROM m limit 10; 02 ...

(转)Live555中RTSPClient分析

有RTSPServer,当然就要有RTSPClient. 如果按照Server端的架构,想一下Client端各部分的组成可能是这样:因为要连接RTSP server,所以RTSPClient要有TCP ...

COM组件设计与应用（四）——简单调用组件

目录(?)[-] 一.前言二.组件的启动和释放三.内存分配和释放四.参数传递方向五.示例程序六.小结本文摘自:http://www.vckbase.net/index.php/wv/121 ...

Java设计模式：工厂模式

问题提出 Java的工厂模式与现实生活中的工厂的模型是很相似的.工厂是用来做什么?当然是用来生成产品.因此在Java的工厂模式的关键点就是如何描述好产品和工厂这2个角色之间的关系. 下面来仔细描述一下 ...

About The Algorithm Simplification

For mode 1, you have to ergod all the data in the files. So the key point to solve this problem is t ...

如何用css让一个容器水平垂直居中

直接上代码: <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <ti ...

Qt编程之qrc文件的链接

在Qt里面,.qrc文件是一种类似XML结构的文件,用结构化数据描述应用程序所需要的资源位置,例如图片,应用程序的图标文件等.它最终是与.ui文件类似都被通过Qt提供的命令行工具生成对应的qrc_XX ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.018 s.