转录组分析的正确姿势

转录组分析的正确姿势

转录组分析是目前应用最广的高通量测序分析技术之一。常见设计是不同样品之间比较,寻找差异基因、标志基因、协同变化基因、差异剪接和新转录本,并进行结果可视化功能注释网络分析等。

转录组的测序分析也相对成熟,从RNA提取、构建文库、上机测序再到结果解析既可以自己完成,又可以在专业公司进行。

概括来看转录组的分析流程比较简单,序列比对-转录本拼接 (可选)-表达定量-差异基因-功能富集-定制分析。整个环节清晰流畅,可以作为最开始接触高通量测序学习最合适的技术之一。

但重点和难点在于理解这些过程都是怎么做的,有什么需要注意的,结果怎么解读,后续分析怎么做。这些只有自己动手操作过,才可能有理解。而理解了一个,再去做其它类型分析,也会轻松很多。

而且现在三代测序火起来了,该怎么去选择呢? 三代测序能帮我们解决什么问题,不能做什么,有什么需要注意的,分析起来有什么不同,二代-三代如何统一分析?也是我们面临的一个新问题。

实验设计这块重要的是对照和至少3个生物学重复,并选择合适的测序通量。ENCODE要求重复之间的Spearman correlation值大于0.9 (遗传背景不一致的生物重复相关系数要大于0.8)。定量基因表达和评估转录图谱相似性只需要中等测序深度;而研究新转录本和可变剪接则需要更深的测序;一般来讲长RNA-seq文库测序深度满足可用reads20-30 million (如果测PE150,换算成碱基数为6G-9G)。

另外一个需要注意的是测序的批次效应,保证自己的样品同时处理、RNA同时提取、同时构建文库和上机测序。这些环节虽然不能总受我们控制,但记录下对应的操作时间和批次,最后在绘制表达图谱时与实验相关参数进行关联展示 (利用我们介绍的热图简化高颜值可定制在线绘图工具-第三版),从而保证结果没有受到试验中处理批次的影响。ENCODE计划有一篇文章在比较人和小鼠不同组织的表达谱相似度时得到的结果是样品按物种而非组织聚在一起,这与之前认为的发育通路的保守性不符。后来发现是测序批次捣的鬼,做了批次效应矫正后,表达图谱按组织而非物种聚在一起了。

测序环节通常不需要自己操作,测序公司都很成熟,但测序的原理需要知道。这会影响到后续分析时参数的选择,比如知道什么是插入片段大小,什么是链特异性测序,什么情况会有接头序列,双端测序如何测等。

获得数据后,就涉及到数据的传输和质量评估(也包括如何从公共数据库下载数据)和文件格式的转换。FASTQ格式解释和质量评估中有些提及。质量评估的意义在于从测序质量角度评价建库和测序的成功与否,指导接头和低质量碱基的去除。这一步参数控制的严格与否对后续的比对会有影响,同时也会受到后续分析选择的工具的影响。对Linux系统一定程度的了解,是进行这些工作的基础。

39个转录组分析工具,120种组合评估(转录组分析工具哪家强)中讲述了如何选择、评估合适的比对工具,序列拼装工具,定量工具和差异分析工具。值得我们在进入正式的分析之前,仔细阅读。另外类似的评估文章,还有几篇,都可以一并读一下,这样在后期分析时对工具的选择和使用才更得心应手。

工具比较类文章一般只告诉你做了什么,不告诉你这么做的原因是什么,而且每一步细分开来又有很多小细节需要注意,比如在比对环节就会涉及到:不同的样本如何选择合适的基因组和注释文件,什么样的软件支持Junction reads的比对,什么样的比对率是合适的,比对质量怎样,测序中RNA有无降解或选择偏好性,测序饱和度如何等。

这些可能都不会体现在最终的结果中,但都是确保后期结果可靠性所必须要做的事情。2002年诺贝尔奖得主Sydney Brenner曾对数据分析做过提醒Garbage in, Garbage out。软件是死的,提供了格式正确的输入,就可以得到输出,但输出正确与否,就得靠人的经验来判断了。

在后面的差异基因鉴定阶段,还存在把FPKM值转换为整数再提交给DESeq2做分析的,软件不报错,但结果不对。或者能顺着教程运行DEseq2分析,但换成自己的数据就不知道如何下手的。这些问题都需要在实践过程中持续不断的试错、阅读更多的文章和教程来步步矫正。这当然是一个耗时耗力的过程,那么有没有一个更好的方式呢?

生信宝典团队经过紧张的筹备,决定推出一系列的针对生信学习和高通量分析的兴趣小组(在生信学习系列教程的基础上进一步拓展和深入),跟大家一起去走过这段历程。我们的口号是易生信,毕生缘,希望能通过短暂高强度的训练快速推进大家在生信分析领域的进展。

但生信学习是个缓慢的过程,需要教、学、练、改不断的循环。我们希望能通过系列课程,再加上四段式培训模式集中讲解实战(2天)-自行练习(5天)-再讲解答疑考核(2天)-后续视频观摩和群内讨论跟大家一起探索如何尽可能快的学会生信,学到可以自己做,有问题自己可以解决的程度。点击阅读原文可查看详细信息。

课程简介

一、转录组的应用、设计和案例分享

  1. 转录组学研究技术介绍
  2. 转录组学实验设计和测序原则、注意事项
  3. 转录组学文章案例分析
  4. 在线基因表达资源数据库

二、转录组分析流程实战

  1. 测序数据质量评估和清洗
  2. 基于比对的差异基因分析
  3. 不基于比对的差异基因分析
  4. 转录本组装和选择性剪接分析
  5. 目标基因富集分析

三、转录组高级分析

  1. WGCNA基因共表达分析
  2. WGCNA基因、表型关联分析
  3. Cytoscape 共表达网络绘制
  4. 转录组常见图形在线绘制

四、三代测序技术概述

  1. PacBio和Oxford Nanopore测序的原理
  2. 三代测序的特点和应用
  3. 三代测序在转录组研究的优势和案例分享

五、三代测序基本分析流程

  1. 原始测序序列去除接头和错误序列
  2. 提取环形一致序列读长(CCS reads)
  3. CCS reads分类(包括全长和非全长CCS reads)
  4. CCS reads聚类(根据CCS reads序列的相似性)获得最终的转录本集合
  5. 最终转录本比对回基因组
  6. 转录本定量和可变剪接分析

原文地址:https://www.cnblogs.com/wangprince2017/p/9818077.html

时间: 2024-10-19 02:14:27

转录组分析的正确姿势的相关文章

docker centos rpm离线安装1.8.2及pull的正确姿势

1.离线安装 本次只针对1.8.2版本,所需要的rpm包如下 docker-engine-1.8.2-1.el7.centos.x86_64.rpm(已上传51cto) libcgroup-0.41-8.el7.x86_64.rpm libcgroup-devel-0.41-8.el7.x86_64.rpm libcgroup-pam-0.41-8.el7.x86_64.rpm libcgroup-tools-0.41-8.el7.x86_64.rpm(libcgroup请参考开源镜像库) 简单

使用layoutinflater的正确姿势

使用layoutinflater的正确姿势 一开始接触安卓开发的时候,知道layoutinflater是用来将布局文件生成对应的View.那时候还是懵懵懂懂知道需要传递一个layoutId一个parent参数和一个false参数.那时候就这样用,初初还是好好的.直到后来随着进一步学习安卓开发发现layoutinflater的这两个参数是有大大的门道在里面. 然后这一篇博客可以说是我对layoutinflater使用的一个总结. 怎么添加一个View到ViewGroup? 在讨论怎么使用layou

开发函数计算的正确姿势 —— 爬虫

在 <函数计算本地运行与调试 - Fun Local 基本用法> 中,我们介绍了利用 Fun Local 本地运行.调试函数的方法.但如果仅仅这样简单的介绍,并不能展现 Fun Local 对函数计算开发的巨大效率的提升. 这一次,我们拿一个简单的场景来举例子--开发一个简单的爬虫函数(代码参考函数计算控制台模板),介绍如何以正确姿势,从零开始,开发一个自动伸缩.按调用次数收费的 serverless 爬虫应用. 开发步骤我们将这个完整的应用拆分成多步,并且在每一步完成后,我们都会进行相应的运

揭秘“撩”大数据的正确姿势:生动示例解说大数据“三驾马车”

我是我:"缘起于美丽,相识于邂逅,厮守到白头!" 众听众:"呃,难道今天是要分享如何作诗?!" 我是我:"大家不要误会,今天主要的分享不是如何作诗,而是<揭秘:'撩'大数据的正确姿势>,下面进入正题." 话说当下技术圈的朋友,一起聚个会聊个天,如果不会点大数据的知识,感觉都融入不了圈子,为了以后聚会时让你有聊有料,接下来就跟随我的讲述,一起与大数据混个脸熟吧,不过在"撩"大数据之前,还是先揭秘一下研发这些年我们都经

从方法到思维:什么是应用逻辑架构的正确姿势?

Blog: https://blog.yilon.top 作者: 阿里技术 地址: https://zhuanlan.51cto.com/art/202004/613905.htm 本文分享阿里资深技术专家六铢的架构方法论,这套方法论中包含了详细的架构推导逻辑,希望能够帮助大家在工作中从各个粒度.各个层次来做好架构工作.较长,同学们可先收藏再看. 一.背景 1.1 架构中的问题识别 需求分析,架构实现,(新需求,架构改动)* n = 推倒重来. 这个过程是一个循环往复的过程,有的产品每年都会推倒

程序员取悦女朋友的正确姿势---Tips(iOS美容篇)

前言 女孩子都喜欢用美图工具进行图片美容,近来无事时,特意为某人写了个自定义图片滤镜生成器,安装到手机即可完成自定义滤镜渲染照片.app独一无二,虽简亦繁. JH定律:魔镜:最漂亮的女人是你老婆魔镜:程序员不是木头人 核心技术 图片滤镜核心技术的基本思路如下: 核心技术流程 具体流程 1.创建一个图像处理工具类 注:该类实例包括一个图像处理方法,该方法在传入原始图像和一个颜色矩阵后生成一个处理好的图像. @interface JHFeilterManager : NSObject @proper

观看学习视频的正确姿势与姿态

开学至今,时时被二柱子逼得走投无路. 痛定思过,目前的自己确实是"三拍",一拍觉得这样那样一定可以胸有成竹,二拍有了点子拿起手术刀就开始实践,三拍无法实现代码拍屁股放弃.啊,我为了二柱子建了好多好多包,想过好多好多条"去北京的路",结果...还是死于基础太烂.也不愿意头悬梁锥刺股.所以呢,那就改进学习方式呗,提高效率. 整个开发过程中,自己犯了一个很大的错误.即是在第五周中途才突然发现,其实代码在整个学习过程中虽说是基础但不是没有它就建不成大楼.而我,白白的把4周的

Node.js中使用redis数据库的正确姿势

Redis是一个常用的Nosql数据库,一般用来代替Memcached做缓存服务,同时它也支持数据的持久化,有着比较广泛的应用场景.在Java中使用redis我们已经比较熟悉了,那么在node.js和koa.js框架中使用Redis的正确姿势是怎样的呢? Redis 是完全开源免费的,遵守BSD协议,是一个高性能的key-value数据库. Redis 与其他 key - value 缓存产品有以下三个特点: * Redis支持数据的持久化,可以将内存中的数据保持在磁盘中,重启的时候可以再次加载

重磅消息!河南省考正确姿势:安心过双节!(推迟后18届毕业生有福!)

重磅消息!河南省考正确姿势:安心过双节!(推迟后18届毕业生有福!) 小可爱们,说想我了没? 肯定想了是吧哈哈 自恋一分钟! 河南省考推迟消息已确定 正确姿势:安心过双节! 各位小伙伴可以愉快的过双节啦! 开心吧! 不信请看:这次小编不骗你啦! 证据