RNA-seq数据综合分析教程 AKAP95

RNA-seq数据综合分析教程

  • 2
  • 4,055
  • A+

所属分类:Transcriptomics

收  藏

2

RNA-seq数据分析

mRNA-seq是目前最常用的高通量测序技术,一般的用法就是看看基因表达谱,寻找差异表达的基因。我和高通量测序数据分析结缘,也是因为RNA-seq

一开始我对mRNA-seq数据分析一无所知,跑了"tophat+cufflinks"的流程也不知道每一步的原因,把“RNA-seq data analysis:A pratice approach” 看了好几遍,也是云里雾里,当然这些时间并没有白白浪费,终于有一天我恍然大悟,感觉自己终于懂了mRNA-seq数据分析,于是在暑假通过一次实战对自己的所学做了一个总结。

但是到目前为止,我实际遇到mRNA-seq数据分析分析项目就一个,不过问我问题的人还是有的,于是打算一边整理实验的流程,再稍微整理下自己的对这方面的理解。

先来看一道RNA-seq数据分析的题目吧,能解决这道题目意味着你真的理解了RNA-seq数据分析。这道问题很简单,不需要强大的计算能力,只需要一张纸和一支笔而已。

这道题目出自 The biostar handbook

假设有一个物种非常的小,仅仅只有三个基因: A, B, C,并且这三个基因都转录本长度分别为10bp, 100bp, 1000bp. 你想通过两个不同的条件下研究该物种,分别是野生型(WT)和热激后(HWEAT)。

由于神秘力量,你知道在WT条件下,基因A的表达量是基因B的表达量的两倍,你还知道在WT和HEAT两个条件中只有一个基因发生了变化(其他基因不变),并且该变化能用目前研究手段中检测到。

你为了找那个在WT和HEAT里不同的基因,非常激动的去做了一次没有重复的RNA-seq实验。由于你很激动,所以不小心把样本混在了一起,而且混了比HEAT处理多一倍WT的DNA量。不过好消息是样本还是能够分开的,毕竟加了barcode。最终结果就是你测了2倍的WT DNA和一倍的HEAT。

问题:你需要准确的用read覆盖情况来表征根据上述给的条件。数字不重要,你可以随便写,重点是这些数字能够表征基因的表达情况。请用实际的数字来替代下面的问号部分

ID WT HEAT
A ? ?
B ? ?
C ? ?

思考题:当你觉得你选择的数字能够回答上面的问题,那么再来想想下面的题目,如果你能回答所有问题,那么那就理解RNA-seq是如何工作的啦。

  • 由于你在仪器里放了两倍WT材料,你是如何区分出你的样本?
  • 每个条件下,每个基因的CPM是多少?
  • 每个条件下,每个基因的RPKM是多少?
  • 每个条件下,每个基因的TPM是多少?
  • 你怎么知道基因在WT样本中,基因A的表达量真的是基因B表达量的两倍?
  • 你能知道WT和HEAT处理中表达量发生变化的基因嘛?
  • 当前面的3X2的位置的“?”都有了正确的值,这个问题也是可解决的嘛?

然后,你可以再想想:

  • 你需要测多少的read,才能让CPM有一个不错的数值?
  • 你需要测多少的read,才能让RPKM有一个不错的数值?
  • 你需要测多少的read,才能让TPM有一个不错的数值?
  • 你觉得引入上述这些具有任意比例因子的措施是否有意义,还是只为了让数字看起来“很好”?

原文地址:https://www.cnblogs.com/wangprince2017/p/9938617.html

时间: 2024-10-02 23:45:00

RNA-seq数据综合分析教程 AKAP95的相关文章

最新选择Godaddy主机方案美国数据中心教程指导

随着Godaddy官方管理层的变动之后,主营重心已经从当初的域名开始转向到域名和主机产品上.这点我们从其发布域名优惠信息的频率也可以看到,而且我们可以看到常年的主机半价优惠,以及针对主机销售年付方案赠送免费域名,也算是跟随其他职业主机商家的趋势.而且从主机的速度和性能.稳定性和安全性已经较为之前有很大的改进. 可以这么说,Godaddy主机产品已经逐渐的步入一类主机产品商中,这里不仅仅有域名,而且还有主机产品.我们都知道,在Godaddy主机购买过程中,不同于其他专业的主机商有不同的数据中心在购

EXCEL规范数据输入教程-验证身份证号

EXCEL日常工作中经常会输入身份证号码,一不小心就可能出错,今天大飞老师就分享这样一个示例EXCEL规范数据输入教程-验证身份证号. 我们首先要保证在EXCEL中能正确输入身份证号码(PS:身份证号18位,直接输入就会变成科学计数法形式1.235E+17),可以通过两种方式.方式一:单引号+身份证号码如:'123456789111111111,方式二:先改变单元格类型为文本格式,然后再输入身份证号码. 我们要学习一个EXCEL函数LEN,可以返回字符的个数,我们填写一个身份证号码,通过LEN可

Flink视频教程_大数据Flink教程下载

Flink视频教程_大数据Flink教程下载课程下载:https://pan.baidu.com/s/1LXm9W30jt4sufJvJakx5Dw 提取码:mazb 本课程将基于真实的电商分析系统构建,通过Flink实现真正的实时分析,该系统会从无到有一步一步带大家实现,让大家在实操中快速掌握Flink技术. 课程所涵盖的知识点包括Flink.Kafka.Flume.Sqoop.SpringMVC.Redis.HDFS.Mapreduce.Hbase.Hive.SpringBoot.Sprin

微信小程序开发本地数据缓存教程

微信小程序开发过程中,本地数据缓存是必不可少的一部分.而且本地数据缓存的用途还挺多的,下面木鱼小铺(https://www.muyu007.cn)就和大家分享一下微信小程序开发本地数据缓存教程,希望对大家有所帮助! 第一步:读写本地数据缓存 微信小程序为了方便开发者缓存数据提供了读写本地数据缓存接口,读本地数据缓存采用的是wx.getStorage/wx.getStorageSync接口,写本地数据缓存的是wx.setStorage/wx.setStorageSync接口.其中以Sync结尾的是

Kylin大数据 实战 教程

Kylin大数据实战教程链接:https://pan.baidu.com/s/17vuLNQDjBGUirQV_IdXgfg提取码:bj4b 复制这段内容后打开百度网盘手机App,操作更方便哦课程学习地址:https://www.xuetuwuyou.com/course/316请添加链接描述课程出自学途无忧网:www.xuetuwuyou.com咨询QQ:2591905126 本课程为专题课,通过全面讲解Kylin架构原理.分布式集群搭建以及项目案例,让你快速掌握Kylin实时大数据BI技术,

大数据基础教程:创建RDD的二种方式

大数据基础教程:创建RDD的二种方式 1.从集合中创建RDD val conf = new SparkConf().setAppName("Test").setMaster("local")      val sc = new SparkContext(conf)      //这两个方法都有第二参数是一个默认值2  分片数量(partition的数量)      //scala集合通过makeRDD创建RDD,底层实现也是parallelize      val 

好程序员大数据实用教程之面向对象进阶

好程序员大数据实用教程之面向对象进阶:包的创建与使用 是对一个程序中指定功能的部分代码进行包装 ####构造方法 是一个方法 特殊点: 构造方法没有返回值,不是指的返回值类型是void,而是根本就不写返回值类型 方法名字和类名相同 构造方法不能用static来修饰 构造方法调用的时机: 通俗来讲:是在实例化一个对象的时候调用的 一般情况下,我们在构造方法中做什么: 对对象的某一些属性进行初始化赋值操作 实例化对象的过程: Person xiaoming = new Person(); new :

2019城市数据分析师教程 智慧城市数据分析视频教程

┣━━51实践专题一_城市空间数据的视觉表达 [298.6M] ┃    ┣━━51.1数据工作流及软件须知.mp4 [57M] ┃    ┣━━51.23D_Bar立体动态图表展现.mp4 [40.6M] ┃    ┣━━51.33D_City_Map城市综合地图.mp4 [38.6M] ┃    ┣━━51.4Global球面飞线轨迹模拟.mp4 [36.3M] ┃    ┣━━51.52D_Route_Map城市动态轨迹模拟.mp4 [56.6M] ┃    ┗━━51.63d_Bar_M

Linux系统中备份和恢复MongoDB数据的教程

版本:mongodb3.2.6 备份格式: /data/mongodb/bin/mongodump -h IP --port 端口号 -u 用户 -p 密码-d 数据库名-o 存储路径 恢复格式: /mnt/mongodb/bin/mongorestore -h IP --port 端口号 -u 用户名-p密码  -d 数据库名 备份的文件夹名/* 注意,如果mongodb开启了认证登录,那么需要加参数--authenticationDatabase=admin, 因为笔者使用的mongodb开