kallisto:Near-optimal RNA-Seq quantification

Near-optimal RNA-Seq quantification https://pachterlab.github.io/kallisto

kallisto

kallisto是一个用高通量测序片段从RNA序列或更为普遍的目标序列中量化转录丰富度的一个程序。它是基于伪对齐的新的数据,用于快速确定reads目标,而无需alignment。在标准的RNA序列数据中,kallisto能够在mac系统上用不到十分钟的时间构建索引,用不到三分钟的时间量化(也就是分类)3千w人类的reads。reads伪对齐保留关键信息需要量化,并且kallisto不仅速度快,而且比现有的量化工具准确。事实上,由于伪对齐的过程是对reads出错上的健壮性,在许多基准中kallisto显著优于现有的工具。

kallisto能够用sleuth量化RNA序列分析。

时间: 2024-10-26 00:45:13

kallisto:Near-optimal RNA-Seq quantification的相关文章

xgene:之ROC曲线、ctDNA、small-RNA seq、甲基化seq、单细胞DNA, mRNA

灵敏度高 == 假阴性率低,即漏检率低,即有病人却没有发现出来的概率低. 用于判断:有一部分人患有一种疾病,某种检验方法可以在人群中检出多少个病人来. 特异性高 == 假阳性率低,即错把健康判定为病人的概率低. 用于:被某种试验判定为患病的人中,又有多少是真的患了这种病的. 好的检测方法:有高的灵敏度(低的假阴性率).同时又有高的特异性(低的假阳性率). ROC 曲线: 横轴:100 - 特异性..即100减去特异性,特异性高,100减去特异性就低,故越小越好. 纵轴:灵敏度值. ROC分析图的

xgene:WGS,突变与癌,RNA-seq,WES

 人类全基因组测序06 SNP(single nucleotide polymorphism):有了10倍以上的覆盖深度以后,来确认SNP信息,就相当可靠了. 一个普通黄种人的基因组,与hg19这个参考基因组序列相比,会有350万个左右的SNP.又有大概2万个是落在外显子上的,而非同义的SNP有大概9千个. 所谓非同义的SNP,就是这些SNP是会引起蛋白质的序列变化的. indel:(insertion & deletion)是指小于50个bp以内的微小的插入.和缺失突变.一个普通黄种人的基因组

RNA测序相对基因表达芯片有什么优势?

RNA测序相对基因表达芯片有什么优势? RNA-Seq和基因表达芯片相比,哪种方法更有优势?关键看适用不适用.那么RNA-Seq适用哪些研究方向?是否您的研究?来跟随本文了解一下RNA测序相对基因表达芯片有什么优势? 无假设的研究设计和更高的发现能力RNA-Seq是一种基于测序的强大方法,让研究人员能够打破传统技术的低效和花费,如实时定量PCR(RT-PCR)和芯片.无论是将RNA-Seq添加到现有的研究方法中,还是从一种方法彻底转换到另一种,RNA-Seq都带来了许多显而易见的优势.这种方法不

codeforces 710B B. Optimal Point on a Line(数学)

题目链接: B. Optimal Point on a Line 题意: 给出n个点,问找出一个点使得这个点到所有的点的距离和最小; 思路: 所有点排序后的中位数;这是一个结论; AC代码: #include <iostream> #include <cstdio> #include <cstring> #include <algorithm> #include <cmath> #include <bits/stdc++.h> #in

11782 - Optimal Cut(树形DP+记忆化搜索)

题目链接:11782 - Optimal Cut 题意:按前序遍历给定一棵满二叉树,现在有k次,可以选k个节点,获得他们的权值,有两个条件: 1.一个节点被选了,他的子节点就不能选了. 2.最终选完后,根到所有叶子的路径上,都要有一个被选的节点. 思路:树形dp,dp[u][k]代表在结点u,可以选k个节点,那么就分两种情况 选u节点,dp[u][k] = node[u]; 选子节点之和,那么就把k次分配给左右孩子,dp[u][k] = max(dp[u][k], dp[u][i], dp[u]

linux学习:常用shell语句

一.正则表达式的使用 cd /usr/share/dict 1.找出words文件下所有以a开头t结尾的单词 egrep "^a.*t$" words 2.匹配以abcde开头,以at结尾的单词 egrep "\<[abcde]at\>" words 3.以大写字母开头,以t结尾 egrep "^[[:upper:]]t$" words 二.管道的使用 egrep "^a.*t$" words|wc -w 三.cu

Python学习笔记五:数字和字符串

数据类型是不允许改变的,这就意味着如果改变数字数据类型得值,将重新分配内存空间. Python数字类型转换 int(x [,base ]) 将x转换为一个整数 long(x [,base ]) 将x转换为一个长整数 float(x ) 将x转换到一个浮点数 complex(real [,imag ]) 创建一个复数 str(x ) 将对象 x 转换为字符串 repr(x ) 将对象 x 转换为表达式字符串 eval(str ) 用来计算在字符串中的有效Python表达式,并返回一个对象 tupl

linux下seq命令

seq命令:用于产生一个数到另一个数的整数 例1: [[email protected] 0702]# seq 1 5 1 2 3 4 5 [[email protected] 0702]# seq 5 1 2 3 4 5 seq 1 5和seq 5的结果是一样的,未指定起始值默认是从1开始 例2:产生一组在7和30之间的整数,间隔为3 [[email protected] 0702]# seq 7 3 30 7 10 13 16 19 22 25 28 例3: -w 输出结果同宽,不足用0填补

算法题:求一个序列S中所有包含T的子序列(distinct sub sequence)

题: 给定一个序列S以及它的一个子序列T,求S的所有包含T的子序列.例: S = [1, 2, 3, 2, 4] T = [1, 2, 4] 则S的所有包含T的子序列为: [1, 2, 3, 2, 4] [1, 2, 3, 4] [1, 2, 2, 4] [1, 2, 4] 解: 首先可以拆解为两个问题: 1. 求S的所有子序列:其中又涉及到去重的问题. 2. 求S的所有子序列中包含T的子序列. 暂时先不考虑去重,看看问题1怎么解: 一.求S的子序列 单纯求一个序列的所有子序列的话,就是求序列的