miRNA分析--靶基因预测(三)

miRNA分析--数据过滤(一)

miRNA分析--比对(二)

根据miRNA Target Prediction in Plants, miRNA并非所有区域都要求严格匹配,其中第1位碱基和第14位以后的碱基是允许错配(以miRNA 5‘为始)。

miRNA 文件提交不管是U或者T都是可以的

miRNA 靶基因预测我采用了3个工具

1、psRNATarget: A plant Samll RNA Target Analysis Server

进去以后,提交自己miRNA文件,fasta格式,并且提交cds序列,按照默认参数进行预测即可

2、TAPIR: target prediction for plant microRNAs

同样提交miRNA 文件,以及cds序列,该在线工具序列数必须少于500条,若多余则分批提交

3、psRobot: Plant Small RNA Analysis Toolbox

提交miRNA文件,以及对应的cds序列即可

psRobot除了网页版工具,还可以在http://omicslab.genetics.ac.cn/psRobot/downloads.php下载本地版, 使用方法为:

 1 psRobot_tar -s mature.fa -t Araport11_genes.201606.cdna.fasta -o target.gTP
 2 ##参数说明
 3 -s: 待预测的miRNA
 4 -t: 用于搜索的序列
 5 -o: 输出文件
 6 -ts: 输出结果的阈值
 7 -fp: 5‘后第几位开始是必要区间(1~2), 默认2
 8 -gl: 5‘后第几位开始是必要区间(8~31) 默认是17
 9 -gl: 从第几个碱基后允许出现gap/bulge, 默认17
10 -gn: 允许存在几个gap/bulge, 默认1

Ref:

1、植物如何进行miRNA靶基因预测

原文地址:https://www.cnblogs.com/zhanmaomao/p/12150527.html

时间: 2024-10-08 01:12:41

miRNA分析--靶基因预测(三)的相关文章

11、预测和鉴定miRNA的靶基因

转载:http://www.oebiotech.com/Article/mirnabjyyc.html http://www.ebiotrade.com/newsf/2014-9/201492594150379.htm miRNA自从被发现以来,一直备受关注,俨然已成为非编码RNA家庭中永不凋零的"玫瑰".关于miRNA,主要有两个研究方向,其一是作为biomarker,这方面研究仅需足够庞大的临床样本支撑即可:miRNA的另一研究方向为功能机制研究,此时必须有miRNA靶基因的参与,

用隐马尔可夫模型做基因预测

什么是隐马尔可夫模型 隐马尔可夫模型(Hidden Markov Model,HMM) 是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程.其难点是从可观察的参数中确定该过程的隐含参数.然后利用这些参数来作进一步的分析,例如模式识别,特别是我们今天要讲的基因预测.是在被建模的系统被认为是一个马尔可夫过程[一段组装好的序列]与未观测到的(隐藏的)的状态[哪些是编码区哪些不是]的统计马尔可夫模型. 下面用一个简单的例子来阐述: 假设我手里有两个颜色不同的骰子,一个是橘色(Coding,C)的另

基因数据分析主流软件与基因预测方法步骤-搬运工

源自:http://www.bbioo.com/lifesciences/40-114214-1.html 1. 基因数目预测的主流软件 GENSCAN就是一个经典的基因预测软件.1996年由MIT的Chris Burge开始编写这个软件程序.当时,Burge的许多同事主张采用比较的方法,他们随机选取一个最新测序基因组中基因的DNA序列,与数据库中已存在的基因进行联配.但是Chris Burge认为:"利用人类基因组所获知的信息,可能不能发现某些新的基因." 他还积极吸取了加州大学计算

最简洁的Python时间序列可视化:数据科学分析价格趋势,预测价格,探索价格

时间序列数据在数据科学领域无处不在,在量化金融领域也十分常见,可以用于分析价格趋势,预测价格,探索价格行为等. 学会对时间序列数据进行可视化,能够帮助我们更加直观地探索时间序列数据,寻找其潜在的规律. 本文会利用Python中的matplotlib[1]库,并配合实例进行讲解.matplotlib库是?个?于创建出版质量图表的桌?绘图包(2D绘图库),是Python中最基本的可视化工具. [工具]Python 3 [数据]Tushare [注]示例注重的是方法的讲解,请大家灵活掌握. 01 单个

一个内存增长问题的分析和处理(三)

和框架部门的同事一起,经过valgrind大量的测试和验证,并没有发现有确切的内存泄露的代码段.对于C和C++程序,出现内存增长,可能我们很自然的就去内存泄露方面去思考,有时候,这种方向可能不一定对. 在解决这个问题的过程中,生成上又出现了另外一个内存增长的问题.这次的现象很明显,就是一个进程,能清晰的看到内存在不断的增长,进程停止后,内存就直接释放,下次还是会缓慢增长.大家的思路就是检查下代码,看看有没有内存泄露,由于程序中没有使用new 和 malloc的地方,所以不存在直接的内存操作.这样

Hadoop学习笔记—20.网站日志分析项目案例(三)统计分析

网站日志分析项目案例(一)项目介绍:http://www.cnblogs.com/edisonchou/p/4449082.html 网站日志分析项目案例(二)数据清洗:http://www.cnblogs.com/edisonchou/p/4458219.html 网站日志分析项目案例(三)统计分析:当前页面 一.借助Hive进行统计 1.1 准备工作:建立分区表 为了能够借助Hive进行统计分析,首先我们需要将清洗后的数据存入Hive中,那么我们需要先建立一张表.这里我们选择分区表,以日期作

JUC源码分析-集合篇(三)ConcurrentLinkedQueue

JUC源码分析-集合篇(三)ConcurrentLinkedQueue 在并发编程中,有时候需要使用线程安全的队列.如果要实现一个线程安全的队列有两种方式:一种是使用阻塞算法,另一种是使用非阻塞算法.使用阻塞算法的队列可以用一个锁(入队和出队用同一把锁)或两个锁(入队和出队用不同的锁)等方式来实现.非阻塞的实现方 式则可以使用循环 CAS 的方式来实现.本节让我们一起来研究一下 Doug Lea 是如何使用非阻塞的方式来实现线程安全队列 ConcurrentLinkedQueue 的,相信从大师

miRNA分析--比对(二)

miRNA分析--数据过滤(一) 在比对之前为了减少比对时间,将每一个样本中的reads进行合并,得到fasta格式,其命名规则如下: 样本_r数子_x数字 r 中的数字表示reads序号: x 中的数字表示该条reads重复次数 比对分为两条策略 1.根据本物种已有的miRNA序列进行比对, 已知当miRNA序列从 miRBase或者 sRNAanno得到 (应该将clean reads比对到所研究物种到tRNA, rRNA, snoRNA,mRNA等数据,允许一个错配,将比对上等reads过

edgeR之配对检验分析差异基因的使用教程

edgeR的介绍 背景 RNA-seq表达谱与生物复制的差异表达分析. 实现一系列基于负二项分布的统计方法,包括经验贝叶斯估计,精确检验,广义线性模型和准似然检验. 与RNA-seq一样,它可用于产生计数的其他类型基因组数据的差异信号分析,包括ChIP-seq,Bisulfite-seq,SAGE和CAGE. 简介 edgeR包是进行RNA-seq数据分析非常常用的一个R包.该包需要输入每个基因关于每个样本的reads数的数据,每行对应一个基因,每一列对应一个样本.edgeR作用的是真实的比对统