snap

1、snap的下载与安装

snap的说明文档: /home/share/biosoft/snap/00README

下载:

wget http://korflab.ucdavis.edu/Software/snap-2013-11-29.tar.gz

文件说明:

    DNA               Contains some sample sequences
    HMM               Contains SNAP parameter files
    LICENSE           The GNU General Public License
    Makefile          For compiling
    Makefile.include  Automatically generated, should not be edited
    fathom.c          Utility for investigating sequences and annotation
    forge.c           Parameter estimation
    hmm-assembler.pl  Creates HMMs for SNAP
    snap.c            Gene prediction program
    zoe*              Sources from the ZOE library

2、编译

make

3、环境变量设置(Enviroment)

SNAP使用ZOE环境变量来查找HMM文件。设置这个指向包含此文件的目录。如果你不设置Zoe环境变量,依旧可以用SNAP,但是必须指定参数文件的明确路径

export ZOE=/home/share/biosoft/snap/Zoe/

4、参数估计

序列必须采用FASTA格式。如果你没有彼此之间联系太紧密这样的基因,这是个好主意。基因结构必须是ZFF格式。ZFF是什么?它是非标准格式(即。除了我,没有人使用它。ZFF有两种格式,短格式和长格式。在短格式中,有4个字段:Label、Begin、End、Group。第四个字段是可选的。Label是一个受控词汇表(参见zoefeatures .h浏览完整名单)。一个基因的所有外显子转录单元)必须共享相同的唯一组名。链的在坐标中隐含特征,因此如果开始>结束,则特征位于负链。下面是两个序列的简短格式示例,在正链上含有一个基因。

    >sequence-1
    Einit    201    325   Y73E7A.6
    Eterm   2175   2319   Y73E7A.6
    >sequence-2
    Einit    201    462   Y73E7A.7
    Exon    1803   2031   Y73E7A.7
    Exon    2929   3031   Y73E7A.7
    Exon    3467   3624   Y73E7A.7
    Exon    4185   4406   Y73E7A.7
    Eterm   5103   5280   Y73E7A.7

长格式:

The long format adds 5 fields between the coordinates and the group: Strand,Score, 5‘-overhang, 3‘-overhang, and Frame. Strand is +/-. Score is any floating
point value. 5‘- and 3‘-overhang are the number of bp of an incomplete codon at each end of an exon. Frame is the reading frame (0..2 and *not* 1..3). Here‘s an example of the long format:

long格式在坐标和组之间添加了5个字段:Strand、Score、5‘-overhang、3‘-overhang和Frame。链是+ / -。Score是任何浮点值。5‘-和3‘-伸出量是外显子两端不完整密码子的bp值。帧是读取帧(0..2和*not* 1..3)。下面是长格式的一个例子:

    >Y73E7A.6
    Einit    201    325   +    90   0   2   1   Y73E7A.6
    Eterm   2175   2319   +   295   1   0   2   Y73E7A.6
    >Y73E7A.7
    Einit    201    462   +   263   0   1   1   Y73E7A.7
    Exon    1803   2031   +   379   2   2   0   Y73E7A.7
    Exon    2929   3031   +   236   1   0   0   Y73E7A.7
    Exon    3467   3624   +   152   0   2   0   Y73E7A.7
    Exon    4185   4406   +   225   1   2   2   Y73E7A.7
    Eterm   5103   5280   +    46   1   0   2   Y73E7A.7

The most important part of parameter estimation is preparing a training set.There are many ways to go about this. At the end, you want these in the ZFF
short format. Save the ZFF as genome.ann and the FASTA as genome.dna. The first step is to look at some features of the genes:

fathom genome.ann genome.dna -gene-stats 

接下来,你要验证这些基因没有明显的错误:

fathom genome.ann genome.dna -validate

您可能会发现一些错误和警告。在某种基因组中浏览器(genome browser)删除那些真正的错误。接下来,将序列分解成每个序列有一个基因片段,使用以下命令:

fathom -genome.ann genome.dna -categorize 1000

在基因的每一边都有多达1000个bp。你会发现一些新的文件。

    alt.ann, alt.dna (genes with alternative splicing)
    err.ann, err.dna (genes that have errors)
    olp.ann, olp.dna (genes that overlap other genes)
    wrn.ann, wrn.dna (genes with warnings)
    uni.ann, uni.dna (single gene per sequence)

使用以下命令将单基因转换为正链:

fathom uni.ann uni.dna -export 1000 -plus

你会发现4个新文件:

    export.aa   proteins corresponding to each gene
    export.ann  gene structure on the plus strand
    export.dna  DNA of the plus strand
    export.tx   transcripts for each gene

参数估计程序forge创建了许多文件。你可能要创建一个目录,以便在执行程序之前保持整洁。

mkdir params
cd params
forge ../export.ann ../export.dna
cd ..

最后是构建一个HMM模型:

hmm-assembler.pl my-genome params > my-genome.hmm

原文地址:https://www.cnblogs.com/djx571/p/11063594.html

时间: 2024-11-09 05:55:00

snap的相关文章

Snap们崛起告诉我们:这个世界太需要悄悄话

北京时间3月3日凌晨,"阅后即焚"应用Snapchat母公司Snap在纽约证券交易所上市.开盘价24美元,比其初定的17美元IPO价格高出近41.2%,按照24美元的股价计算,Snap的市值已经超过了336亿美元(约合2313.9亿人民币).火爆的态势,也在佐证着人们对互联网社交的深入思考. 长久以来,互联网似乎都是建立在社交元素之上的,网民在这张社交大网上不可避免的会遭遇到隐私泄露等问题.而以Snapchat为代表的"阅后即焚"反社交应用的出现及火爆,却在引领一股

使用Snap.svg类库实现的抖动式的幻灯播放效果

在线演示 本地下载 这个幻灯中.使用了SVG来生成具有动画弧度的幻灯背景效果.假设你在项目中可以支持现代浏览器的话.尝试一下这个效果吧,非常赞! 想了解基础使用,观看这个藐视频吧:Snap.svg处理和操作SVG图形

真有用?Snap和Flatpak 通吃所有发行版的打包方式。

导读 最近我们听到越来越多的有关于Ubuntu的Snap包和由Red Hat员工Alexander Larsson创造的 Flatpak (曾经叫做 xdg-app)的消息.这两种下一代打包方法在本质上拥有相同的目标和特点:即不依赖于第三方系统功能库的独立包装.这种 Linux 新技术方向似乎自然会让人脑海中浮现这样的问题:独立包的优点/缺点是什么?这是否让我们拥有更好的 Linux 系统?其背后的动机是什么?为了回答这些问题,让我们先深入了解一下 Snap 和 Flatpak. 动机 根据Fl

snap.svg实现弹性侧栏菜单

p{text-indent:2em;}前端开发whqet,csdn,王海庆,whqet,前端开发专家 效果预览 众所周知,flash动画类型可以分为补间动画和逐帧动画,补间动画又可以分为属性改变(大小.位置.颜色等)和形状改变(直线变弧线等).网页动画里,我们可以使用css3.javascript(jquery)等实现属性改变,却对形状改变无能为力,那么如何实现网页动画里的形状改变呢?今天提供一种解决方案--通过snap.svg动态改变svg形状实现,案例效果如下图所示,案例灵感来自codrop

Snap股市暴涨暴跌,眼红嫉妒的中国社交路在何方?

美国社交平台阅后即焚应用Snap上市后连番大涨,一度达到336亿美金,成为阿里巴巴后美股最大IPO,不过随后在本周一又迎来了暴跌,市值又跌到了275亿美金. 暴涨暴跌的背后究竟是何原因? Snap上市后市值一路飙升,突破300亿美金,远远超过了Twitter和国内的微博,之所以上市后表现如此强劲主要还是得益于以下几个方面. 其一,与Facebook和Twitter不同,Snapchat在90后的年轻用户群体中有着超高的人气,这些年轻用户的活跃度非常高,每天分享图片和视频的用户高达60%,美国本土

Snap Build Your Own Block修炼之道-添加自定义类别

Snap Build Your Own Block自我修炼方法:1.所有的面向对象,其实是对面向过程的抽象过程而已: 2.面对别人的开源项目时,需要找准源头(即项目运行的起点,当然有的是没有的哈,没有起点时,则按照使用开源项目时,其使用流程,然后一步一步的学习研究): //+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+在Snap Build Your Own Block中添加自定类别所需要修改的JS文件如

Siemens ug二次开发---Snap

什么是Snap? S.N.A.P 是Simple NX Application Programming (简易NX应用编程)的简称.是一个应用程序编程接口Application Programming Interface (API),并且允许用户对NX进行扩充和定制.用他编写出来的应用程序会大大减轻单调重复性工作,提高效率,及时捕捉设计流程中的重要信息. NX已经拥有其他API,其中包括NXOpen,GRIP和Knowledge Fusion (KF),用户也许会问为什么还需要另外的API.原因

Ubuntu Snap 接管 Linux 桌面和 IoT 软件的发行

Canonical 和 Ubuntu 创始人 Mark Shuttleworth 在一次采访中说他不准备宣布 Ubuntu的新 Snap 程序包格式.但是就在几个月之后,很多 Linux 发行版的开发者和公司都宣布他们会把 Snap 作为通用 Linux程序包格式. 为什么呢?因为 Snap 能使一个单一的二进制程序包可以完美.安全地运行在任何 Linux 台式机.服务器.云或物联网设备上.据 Canonical 的 Ubuntu 客户端产品和版本负责人 Olli Ries 说: Snap 程序

CSS Scroll Snap Points简介

介绍这个新CSS属性之前,我想要先讲一下使用JavaScript实现的一个功能-- 将一个元素锁定在滚动视窗之中.众所周知,使用JavaScript实现滚动的行为还是有些难度的. CSS Scroll Snap Points 新规范 指出你仅仅使用几行简单的CSS代码就可以实现以上所述的功能. 新出现的Web技术总是在不断的变化之中,这个规范也处于不断的修改之中.也存在"旧的"与"新的"属性与值.随着浏览器的不断地 支持 ,这个新属性的前景还是不错哒~ 在规范处于中

2013年考研英语(二)阅读真题 第3篇 Snap decisions

Scientists have found that although we are prone to snap over reactions, if we take a moment and think about   how we are likely to react, we can reduce or even eliminate the negative effects of our quick, hard-wired responses. 科学家已经发现:虽然我们易于快速地做出过度反