非链特异性转录组测序

非链特异性转录组测序

转录组(transcriptome)在广义上是指细胞内全部转录产物的集合,狭义上是指细胞中所有转录本(mRNA)的集合。转录组测序通常来说是指依托于高通量测序平台对细胞中的mRNAs进行测序。经过信息的整理和分析,可在不同的样本中挖掘具有意义的差异表达基因,研究可变剪切,融合基因事件和在转录水平上进行性状定位等。转录组测序现已广泛的应用到科研基础研究,临床疾病研究和药物研发等领域。

常规转录组测序根据实验样品的不同可分为真核生物转录组测序和原核生物转录组测序;根据建库时的方法和研究目的不同可分为链特异性转录组建库和非链特异性转录组建库;根据测序物种有无参考基因组可以分为有参基因组转录组测序和无参基因组转录组测序。

技术路线

有参考基因组的转录组测序

无参考基因组的转录组测序

技术优势

测序策略

测序策略 PE100或PE150
建议数据量
真核生物:一般测序5-6G深度测序10G

原核生物:一般测序1G深度测序5-10

收样要求

组织 500mg新鲜植物样本,300mg新鲜动物样本注: 肿瘤组织优先选择RNAlater保存
细胞 >5*106悬浮/贴壁细胞
血液 >3ml全血/全血分离的有核细胞
RNA总量 >3 μg,浓度 >50ng/μl, RIN值>6.5
对于较难进行取材的医学类样品,可以适当降低样本标准。

您可以得到的数据分析

有参非链特异性转录组生物信息学分析流程


常规分析


高级分析


高通量序列与参考基因组比对

测序数据质控分析

基因表达量分析

基因的可变剪切分析(真核生物)

基因结构优化及新转录本预测

SNP、InDel等基因结构变异筛查

样本间基因差异表达分析

差异表达基因的KEGG和GO功能分析


差异基因的蛋白互作分析

个性化定制分析

无参(de novo)非链特异性转录组生物信息学分析流程


常规分析


高级分析


测序数据质控分析

参考序列拼接

Unigene的长度统计及功能注释

Unigene的表达谱构建

SSR分析

ORF预测

SNPs分析

序列信息统计

Unigene在样本之间各类差异基因表达

Unigene的KEGG和GO功能分析


差异基因的蛋白互作分析

个性化定制分析

案例解析

利用肿瘤血小板RNA-seq发现直接利用血液在分子通路层面上诊断

泛癌症、分辨不同癌症类型和鉴定癌症基因突变的方法

(有参转录组测序)

肿瘤相关的血小板(Tumor-educated platelets, TEPs)在全身或病灶范围上会根据肿瘤的生长情况而改变自身mRNA的表达。本研究对228个原发肿瘤或肿瘤转移患者和55个健康个体血液中的血小板细胞进行了转录组测序,欲验证肿瘤血小板中mRNA的变化是否能指导癌症的诊断和分类。测序后,通过序列比对,共鉴定出5,003个已知的血小板mRNA生物标记,例如B2M, PPBP, TMSB4X, PF4等,同时也鉴定出了一些非编码RNA(lncRNAs)。

癌症患者与健康个体相比,1,453种mRNA表达量提高,793种mRNA表达量下降。聚类分析结果显示癌症患者与健康个体的血小板细胞mRNA信息有较大差异。随后,课题组基于差异表达基因,利用不同算法对6种不同的癌症类型进行诊断和区分,结果显示可达到较好的癌症分辨效果。

本研究通过对血小板细胞进行转录组测序,发现了基于肿瘤相关血小板细胞中mRNA的信息对肿瘤进行早期诊断和癌种区分的方法。

Best, Myron G., et al. "RNA-Seq of tumor-educated platelets enables blood-based pan-cancer, multiclass, and molecular pathway cancer diagnostics."Cancer cell(2015): 666-676.(Imapct factor:27.407)

A. 测序后分析5,003个mRNA的上下调表达情况(红色代表上调基因,蓝色代表下调基因)

B.健康个体和肿瘤患者mRNA表达量差异热图(上方横条中红色代表健康个体,灰色代表肿瘤患者)

蝾螈不同组织de Novo转录组测序鉴定与肢臂重生相关mRNA与其编码的蛋白质

(无参转录组测序)

哺乳动物的肢体再生能力非常有限,蝾螈却可以重生自身肢臂。对蝾螈再生肢臂的机制的理解并不透彻,其中一个重要的原因是蝾螈基因组巨大且不完整。本研究对蝾螈16种不同组织(包括肢臂胚芽组织、睾丸、肌肉、卵巢等)的共42个样品进行转录组测序,并de novo拼接测序数据,绘制出了一个近乎于蝾螈全转录组的图谱 (完整率高达88%)。同时,通过对比分析肢臂再生组织和其他组织的mRNA测序数据和表达情况,并结合先前文献,鉴定出了在肢臂再生中特异性表达的转录本和其编码的蛋白;CIRBP和KAZALD1蛋白。本研究除完成高完整度的蝾螈全转录组图谱构建及注释外,还揭示了在蝾螈进行肢体重生中的重要基因,极大地填补了蝾螈肢体再生研究的空白,并为再生医学研究奠定了基础。

Bryant, Donald M., et al. "A tissue-mapped axolotl de novo transcriptome enables identification of limb regeneration factors."Cell reports(2017): 762-776.(Impact factor: 8.282)

A. 针对蝾螈16种不同组织样本的转录组测序和de novo拼接流程

B. 159个在肢臂胚芽组织中富集的mRNA和在各种组织中的表达热图,标黄的基因代表预测为可能与肢臂再生相关的基因

研究趋势与研究热点

寻找研究对象的重要性状、表型或生物标志物;

构建研究对象在不同的处理条件下,或者不同表型研究对象的基因表达谱。寻找表达差异大的关键基因;

研究对象时序性或空间特异性变化的主控因素;

无参考基因组物种的基因表达谱构建;

研究近缘物种之间的进化差异等。

常见问题

在进行转录组测序之后,可以通过哪些方法对目标转录本进行验证?
在进行转录组测序后,生物信息学分析会展现出不同样品中差异较大或有特殊意义的转录本,为了对这些有意义的转录本进行验证和继续研究,qRT-PCR方法可通过对目标转录本的表达进行定量或定性验证。除此之外,还有Northern Blot,FISH(荧光原位杂交)和免疫荧光实验等方法也可用于测序结果验证。

转录组一般要测多大的数据量才合适?
转录组测序所需要的测序量要根据多个因素考量确定,这些因素包括了待测物种转录组大小,待测物种转录组中基因的数量和各类基因的丰度。不同的物种在以上因素的变化可能不同,因此为了保证数据分析结果的可靠性和准确性,我们建议客户一定要在测序之前对待测物种的转录组的大小进行评估。对于有参考基因组的物种,可以根究先前的经验,分析基因组信息、编码基因个数、碱基数及丰度进行预测评估。大部分物种的测序量以6-8G为佳。而多倍体植物,例如八倍体小麦这类基因组较大且复杂的物种来说,我们推荐适当增加测序量至10-12G。

转录组测序的数据质量影响因素主要有哪些?

转录组测序的质量可能会受到以下因素的影响:(1)RNA严重的降解可能会影响建库与测序的质量 (2)过低的RNA起始量可能会影响建库与测序质量,可以通过适当地增加PCR循环数来解决 (3)转录组中基因丰度的较大差异可能会影响基因检测的分辨率,高丰度的基因可能会掩盖低丰度表达的基因。

原文地址:https://www.cnblogs.com/wangprince2017/p/9813737.html

时间: 2024-10-11 22:32:25

非链特异性转录组测序的相关文章

单细胞转录组测序数据的可变剪接(alternative splicing)分析方法总结

可变剪接(alternative splicing),在真核生物中是一种非常基本的生物学事件.即基因转录后,先产生初始RNA或称作RNA前体,然后再通过可变剪接方式,选择性的把不同的外显子进行重连,从而产生不同的剪接异构体(isoform).这种方式,使得一个基因可产生多个不同的转录本,这些转录本分别在细胞/个体分化发育的不同阶段,在不同的组织中有各自特异的表达和功能,从而极大地丰富了编码RNA和非编码RNA种类和数量,进而增加了转录组和蛋白质组的复杂性. 可变剪接主要有以下五种常见的形式: 1

PHP PDO_MYSQL 链式操作 非链式操作类

<?php /* vim: set expandtab tabstop=4 shiftwidth=4: */ // +----------------------------------------------------------------------+ // | PHP version 5 | // +----------------------------------------------------------------------+ // | Copyright (c) 199

字符串的存储是连续的内存空间,非链式注意

转录组分析的正确姿势

转录组分析的正确姿势 转录组分析是目前应用最广的高通量测序分析技术之一.常见设计是不同样品之间比较,寻找差异基因.标志基因.协同变化基因.差异剪接和新转录本,并进行结果可视化.功能注释和网络分析等. 转录组的测序分析也相对成熟,从RNA提取.构建文库.上机测序再到结果解析既可以自己完成,又可以在专业公司进行. 概括来看转录组的分析流程比较简单,序列比对-转录本拼接 (可选)-表达定量-差异基因-功能富集-定制分析.整个环节清晰流畅,可以作为最开始接触高通量测序学习最合适的技术之一. 但重点和难点

测序简史

测序简史 一代 二代测序 三代测序 一文从一代到最新的测序技术,希望能够帮助你. 序 这几天天气很热,热的人心惶惶.因此一直提上日程的所谓的测序简史,也没有时间去好好的落实.中途找过一个行业内的颇有影响力的人,但是他由于种种原因,也没有能踏踏实实的去做这件事情.几经周折,这个任务还是落到了我自己的肩上. 于是乎,我鼓鼓勇气,尝试着去把这段从1977年到2017年的漫长而又渺小的四十年说的有趣些儿. 当我起笔去写这篇文章的时候,小伙伴们还在工作室因为某个服务器后台技术争论不了,这样看来生信人团队还

解读生命密码的基本手段 ——DNA测序技术的前世今生

解读生命密码的基本手段 ——DNA测序技术的前世今生 任鲁风  于军 (中国科学院基因组科学及信息重点实验室,北京基因组研究所) DNA(脱氧核糖核酸)和RNA(核糖核酸)是生命体的两种最基本组成物质,其序列的组成和变化造就了形形色色的生命世界.这两种承担了生命体遗传信息载体功能的物质,一方面在生命的不断繁衍中保持了各个物种的独特面目,另一方面又通过不断的演变改变着自身性状,同时又影响着与之相关的物种,这一规律在生命科学领域被归纳为“中心法则”.笼统而言,几乎全部的生命现象均来源于A.T.C.G

WES 平均测序深度

http://blog.csdn.net/guomutian911/article/details/70312973 1 基础概念 平均测序深度: 指定区域内得到的所有碱基数目与该区域的长度的比值,如果是全基因组,就是整个测序的碱基数目除以基因组的大小.比如人类的基因组大小是3G(30亿个碱基),我的全基因组测序共8.9亿条150bp的reads,那么全基因组范围的平均测序深度就是8.9亿*150/30亿~45X,这个概念很重要! 覆盖度: 指测序获得的序列占整个基因组(或者指定区域)的比例.由

转录组中 实验设计 的相关问题

1.单端测序还是双端测序 2.测序的读长是多少 3.是否建立链特异性库 4.需要多少的测序数据量(即测序深度是多少) 5.设置多少个生物学重复比较好       6.如果我们做了生物学重复还要做技术重复吗? 相关答案: 至少需要三个重复 测序深度对结果的改善不如增加生物学重复

测序数据质量控制

基于边合成边测序(Sequencing By Synthesis,SBS)技术,Illumina HiSeq2500高通量测序平台对cDNA文库进行测序,能够产出大量的高质量Reads,测序平台产出的这些Reads或碱基称为原始数据(Raw Data),其大部分碱基质量打分能达到或超过Q30.Raw Data通常以FASTQ格式提供,每个测序样品的Raw Data包括两个FASTQ文件,分别包含所有cDNA片段两端测定的Reads. FASTQ格式文件示意图如下: FASTQ格式文件示意图 注: