liftover[装载自http://www.cnblogs.com/emanlee/p/5064630.html]

Lift genome positions

Genome positions are best represented in BED format. UCSC provides tools to convert BED file from one genome assembly to another.

Binary liftOver tool

We need liftOver binary from UCSC and hg18 to hg 19 chain file.

Provide BED format file (e.g. input.bed)

NOTE: Use the ‘chr‘ before each chromosome name

chr1    743267  743268  rs3115860
chr1    766408  766409  rs12124819
chr1    773885  773886  rs17160939

Run liftOver:

(1) download liftOver http://hgdownload.cse.ucsc.edu/admin/exe/ (2) chmod +x liftOver(3) download chain file http://hgdownload.cse.ucsc.edu/goldenpath/hg19/liftOver/ (4) prepare input bed file (chr start end others ...)(5) run liftOver./liftOver input.bed hg18ToHg19.over.chain.gz output.bed unlifted.bed

unlifted.bed file will contain all genome positions that cannot be lifted. The reason for that varies. See Various reasons that lift over could fail

REF:

http://www.zilhua.com/906.html (使用方法)

http://genome.sph.umich.edu/wiki/LiftOver  (wiki)

http://www.cnblogs.com/foreverycc/p/3170807.html (使用方法)

http://hgdownload.cse.ucsc.edu/goldenpath/hg19/liftOver/ (liftOver的chain文件)

http://hgdownload.cse.ucsc.edu/admin/exe/ (下载 liftover; http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/liftOver )

http://genome.ucsc.edu/FAQ/FAQformat.html#format1  (bed文件格式)

时间: 2024-10-11 17:36:25

liftover[装载自http://www.cnblogs.com/emanlee/p/5064630.html]的相关文章

AWK用法入门详解

简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理. awk有3个不同版本: awk.nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本. awk其名称得自于它的创始人 Alfred Aho .Peter Weinberger 和 Brian Kernighan 姓氏的首个字母.实际上 AWK

Windows Tomcat 安装

JDK的安装可以参考 http://www.cnblogs.com/emanlee/p/3702535.html ,然后安装apache-tomcat step1:http://tomcat.apache.org/download-70.cgi 下载apache-tomcat-7.0.12 step2:解压文件,这是绿色版本,无需安装.比如放在 H:\software\ 下面 step3:"我的电脑"->"属性"->"高级"->

充分条件和必要条件的联系和区别是什么

http://www.cnblogs.com/emanlee/archive/2010/08/16/1800403.html 什么是充分条件和必要条件? 假设A是条件,B是结论:  由A可以推出B,由B可以推出A,则A是B的充要条件(充分且必要条件).  由A可以推出B,由B不可以推出A,则A是B的充分不必要条件.  由A不可以推出B,由B可以推出A,则A是B的必要不充分条件.  由A不可以推出B,由B不可以推出A,则A是B的不充分不必要条件.  简单一点就是:由条件能推出结论,但由结论推不出这

APUE读书笔记-第五章 标准I/O库

今天草草的把第四章结了,后面的内容分析的也不是很详细,就连书中的例子都没有怎么实验,还是等以后有机会吧. 从5.3节开始研究起吧,这一节主要谈了一个进程预定义的3个流,分别是标准输入.标准输出和标准错误,通过stdin.stdout.stderr引用.这里要和进程中的文件描述符STDIN_FILENO.STDOUT_FILENO.STDERR_FILENO相区分. /* Standard streams. */ extern struct _IO_FILE *stdin; /* Standard

Liinux 学习心得

Linux 内核学习心得 姬梦馨 原创作品 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 反汇编一个简单的C程序:http://www.cnblogs.com/ShadowStealer/p/5225586.html 操作系统是如何工作的:http://www.cnblogs.com/ShadowStealer/p/5246444.html 跟踪分析Linux内核的启动过程:http://www.cnblog

《Linux内核分析》 期中总结

<Linux内核分析> 第一节 计算机是如何工作的:http://www.cnblogs.com/20132109HKK/p/5225027.html <Linux内核分析> 第二节 操作系统是如何工作的:http://www.cnblogs.com/20132109HKK/p/5248108.html <Linux内核分析> 第三节 构造一个简单的Linux系统MenuOS:http://www.cnblogs.com/20132109HKK/p/5272649.ht

AWK整理

处理模式: awk的处理文本和数据的方式是这样的,它逐行扫描文件,从第一行到最后一行,寻找匹配的特定模式的行,并在这些行上进行你想要的操作.如果没有指定处理动作,则把匹配的行显示到标准输出(屏幕),如果没有指定模式,则所有被操作所指定的行都被处理. 组成部分: 处理输入前将做的处理BEGIN, 处理输入过程将做的处理, 处理输出完成后做的处理END 指定分隔符: awk 'BEGIN { FS = ":" }  {print $1}'  /etc/passwd awk -F:  '{p

MySQL--重定向输出内容

参考:http://www.cnblogs.com/emanlee/p/4233602.html select current_date()  into outfile 'dest_path';

SQL 范式(转载)

装载于"http://www.cnblogs.com/KissKnife/ 理论性的东西,往往容易把人人都看得懂的东西写成连鬼都看不懂,近似于主任医生开的药方.从前学范式的时候,把书中得概念翻来覆去看,看得痛心疾首深恶痛绝,再加上老师深切误导,最后一塌糊涂.借助网络资源,自己写了一篇,自己是看懂了,希望对大家也有所帮助,有错误帮忙指正. 数据库范式(Normal forms):是用于规范关系型数据库设计,以减少谬误发生的一种准则. 1NF(first normal form):  Table f