各种平台的表达芯片跟mRNA-seq数据比较

各种平台的表达芯片跟mRNA-seq数据比较

文章见:http://journals.plos.org/plosone ... ournal.pone.0078644指定的细胞系是:Human CCR6+ CD4 memory T cell ,测了6个时间点,共12个样本表达芯片用的是Affymetrix GeneChip HT HG-U13...


文章见:http://journals.plos.org/plosone ... ournal.pone.0078644
指定的细胞系是:Human CCR6+ CD4 memory T cell ,测了6个时间点,共12个样本
表达芯片用的是Affymetrix GeneChip HT HG-U133+ PM arrays
测序用的是: Illumina HiSeq? 2000 platform,PE,All reads were pair-end sequenced with an average insert size of 160 bp, and typical read-length of 90 bp.

芯片情况介绍:41,796 of the 54,714 probe sets were mapped to 20,741 genes, with 10,837 genes having more than one representative probe set.

比较前先把RPKM值和芯片数值归一化:

In summary, RNA-Seq based transcriptome expression was measured as RPKM for 36,004 transcripts, representing 22,300 unique genes. The median RPKM in all 12 samples was 0.49, and 28.6% to 32.5% (average?=?30.3%) of genes had RPKM value of 0 in each sample. In order to make the transcriptome profiling comparable between both platforms (RNA-Seq vs. Microarray), the RPKM values were floored at 0.047, followed by log2 transformation. After the transformation, the difference between the median expression and the floored (minimal) expression by RNA-Seq is equal to the difference between the median expression and the minimal expression by microarray.

文章很有趣,值的细看

RNA-seq: An assessment of technical reproducibility and comparison with gene expression arrays 
http://genome.cshlp.org/content/18/9/1509.full

Another paper with a variety of comparisons between Affymetrix Exon arrays, custom NimbleGen arrays, and RNA-seq: Griffith, et al. Alternative expression analysis by RNA sequencing. Nature Methods. 2010 Oct;7(10):843-847.
http://www.nature.com/nmeth/journal/v7/n10/full/nmeth.1503.html 
尤其是这个correlation图,非常重要~~~~
https://www.researchgate.net/fig ... or-RNA-seq-the-LOG2  
第一次看到把图片描述的比文章还长!~~~~~~~、

文章是:https://genomebiology.biomedcent ... 6/s13059-015-0694-1 
这次是临床样本,498个primary neuroblastomas
芯片是:customized 4x44k oligonucleotide microarrays (Agilent Technologies)
测序是:Illumina HiSeq 2000 platform,TruSeq PE cluster Kit v3
数据都可以在NCBI里面拿到;
Microarray and RNA-seq data can be accessed from the GEO database (www.ncbi.nlm.nih.gov/geo/) with accession numbers GSE49710 and GSE49711, respectively, which are included in SEQC Project SuperSeries GSE47792.

原文地址:https://www.cnblogs.com/wangprince2017/p/9819293.html

时间: 2024-10-07 15:36:40

各种平台的表达芯片跟mRNA-seq数据比较的相关文章

基于335X平台Linux交换芯片驱动开发

基于335X平台Linux交换芯片驱动开发   一.软硬件平台资料 1.开发板:创龙AM3359核心板,网口采用RMII形式. 2.Kernel版本:4.4.12,采用FDT 3.交换芯片MARVELL的88E6321. 二.移植准备工作 1.熟悉88E6321的datasheet及Functional_Specification_Rev.0.05 2.熟悉设备树相关理论和用法 3.熟悉Linux网络驱动MDIO.PHY部分的软件流程 三.DTS文件修改 本工程的DTS文件以am335x-ice

【MDCC 2015】友盟数据平台负责人吴磊:移动大数据平台的架构与实践

转自: http://www.csdn.net/article/2015-10-20/2825962 [MDCC 2015]友盟数据平台负责人吴磊:移动大数据平台的架构与实践 [CSDN现场报道]10月14日-16日,“ 2015移动开发者大会 · 中国” (Mobile Developer Conference China 2015,简称MDCC 2015)在北京新云南皇冠假日酒店隆重举行.本次大会由全球最大中文IT社区CSDN和中国最具关注度的全方位创业平台创新工场联合主办,以“万物互 联,

湖北大数据平台企业有哪些?政企大数据平台如何选择?

2019年两会,各大代表纷纷发表对互联网大数据的建言,足以显示,大数据对于目前互联网的重要性已经国家对大数据的关注度,接下来,我们就具体聊一下湖北地区大数据平台企业有哪些?政企大数据平台软件如何选择? 2019年大家在聊到大数据,可能对它不在是以前浅显的认识,大家对大数据已经有了一定的认识.在大数据的浪潮中,大数据被认为是数据的大容量.数据类型的多样.数据的处理速度快.数据的应用高价值的有趋势预测的.海量的.高增长率的信息资产.但是又因为大数据可给人类社会带来潜在的无可估量的价值. 政企大数据平

Touch panel DTS 分析(MSM8994平台,Atmel 芯片)

在MSM8994平台,Touch panel的DTS写节点/kernel/arch/arm/boot/dts/qcom/msm8994-mtp.dtsi文件里.详细代码例如以下: &soc { [email protected] { [email protected] { compatible = "atmel,atmel_mxt_ts"; reg = <0x4a>; interrupt-parent = <&msm_gpio>; interru

Redis - Windows平台下怎么切换db并且清理数据

Redis 本身支持16个数据库(0~15),通过 数据库id 设置,默认为0.在Windows平台下可以通过启动redis-cli.exe来进入客户端,客户端默认连接数据库0,在客户端里可以输入各种命令. 增加db数量 可以通过修改配置来增加Redis的db数量.在Windows平台下,打开redis.windows.conf,找到databases 16并修改即可. 切换db 通过命令来切换当前的db:select 0,该命令表示切换到第一个数据库.数据库id是从0到15,可以自由切换db,

探秘手淘高可用平台(一)——度量指标及数据平台

系列文章根据手机淘宝客户端基础架构高级开发工程师非台在安卓绿色联盟开发者大会上的分享,共分三篇,介绍手淘技术团队性能和稳定性系统化提升方案EMAS-MOTU的设计原理以及实现思路. 本文重点介绍手淘高可用平台的定义及指标.自动化测试框架和性能稳定性数据平台. 非台 手机淘宝客户端基础架构高级开发工程师 主要负责手机淘宝性能和稳定性的提升 高可用的定义及度量指标 移动端高可用定义 移动端高可?旨在通过设计关键的度量指标,以期望能够客观反映和量化用户在使?过程的真实感受,同时通过指标,建?一系列的工

大数据平台的服务内容以及猛犸大数据平台近期的思考【摘录】

猛犸大数据平台经过去年一年的快速发展,已成为公司内多个产品的大数据开发工具的首选,作为一个当初定位为开发门户的这样一个平台网站,以调度管理为核心,将公司内已有的大数据工具进行了整合,提供了可视化的操作界面.统一的用户权限管理机制.洞悉原油开发流程的用户可以在猛犸上找到很熟悉的感觉,DS接入,MR任务的上传与调度控制,HIVE的查询等等.随着用户不断反馈,猛犸也在不断的进化,越来越多的组件涵盖了进来,交互和流程在不断改善.然而目前这样的框架这就是猛犸的终极形态吗?答案自然是否定的,可以说,眼前的猛

苏宁人工智能研发中心智能创意平台架构成长之路(二)--大数据架构篇

苏宁人工智能研发中心智能创意平台架构成长之路(一)--长篇开篇 https://www.cnblogs.com/laoqing/p/11326132.html   我们接着第一篇继续. (这是第二篇大数据架构篇,成长之路序列会包含多篇,笔者作为这个平台的架构兼技术经理,充分讲述其中的迭代心酸之路以及中间遇到的问题和解决方案) 声明:文章不涉及公司内部技术资料的外泄,涉及的图片都是重画的简易架构图,主要通过架构的演进,讲述分享技术的迭代之路和过程. 在第二轮迭代完成后,第三轮迭代中,我们就开始做平

C#.NET 大型企业信息化系统集成快速开发平台 4.2 版本 - 所有的基础数据都可以恢复删除

客户的需求如下: 所有基礎信息需要記錄創建人,創建時間,更改人,更改時間,刪除人,刪除時間.有停用基礎信息功能(停用不是刪除,只是暫時停用).基礎信息可以查出已經刪除的信息(有選項可以選擇),有方法把刪除信息撤回. 其实很多时候客户的需求也不难,但是全部实现起来总是挺不容易的,因为这个涉及到全局性的设计,所有相关页面的修正,所有业务逻辑的调整等等,还有已经在用系统的影响等等,所以不是凭空架构的系统修改起来就不那么容易了. 1:有选项可以选.是否看被删除的数据?被删除的数据有特殊的显示方式. 2: