区别samtools faid产生的.fai文件功能和bwa index 产生的四个文件的功能

samtools faidx 能够对fasta 序列建立一个后缀为.fai 的文件，根据这个.fai 文件和原始的fastsa文件，能够快速的提取任意区域的序列

用法：

samtools faidx input.fa

该命令对输入的fasta序列有一定要求：对于每条序列，除了最后一行外，其他行的长度必须相同,

>one
ATGCATGCATGCATGCATGCATGCATGCAT
GCATGCATGCATGCATGCATGCATGCATGC
ATGCAT
>two another chromosome
ATGCATGCATGCAT
GCATGCATGCATGC

最后生成的.fai文件如下，共5列，\t分隔；

one 66 5 30 31
two 28 98 14 15

第一列 NAME : 序列的名称，只保留“>”后，第一个空白之前的内容；

第二列 LENGTH: 序列的长度，单位为bp；

第三列 OFFSET : 第一个碱基的偏移量，从0开始计数，换行符也统计进行；

第四列 LINEBASES : 除了最后一行外，其他代表序列的行的碱基数，单位为bp；

第五列 LINEWIDTH : 行宽，除了最后一行外，其他代表序列的行的长度，包括换行符，在windows系统中换行符为\r\n, 要在序列长度的基础上加2；

提取序列：

samtools faidx input.fa chr1 > chr1.fa

samtools faidx input.fa chr1:100-200 > chr1.fa

PS:

引用：http://www.cnblogs.com/xudongliang/p/5200655.html

bwa index 产生的是:

/*/Public_dir/Database/Human/Hg19_ref/bwaIndex/下的hg19.fasta.amb、hg19.fasta.ann、hg19.fasta.bwt、hg19.fasta.pac、hg19.fasta.sa四个文件.作用是为后续比对做准备。

时间： 2024-10-08 01:40:23

区别samtools faid产生的.fai文件功能和bwa index 产生的四个文件的功能的相关文章

Google面试题—有四个线程1、2、3、4。线程1的功能就是输出1，线程2的功能就是输出2，以此类推.........现在有四个文件ABCD

分类: windows编程 C++ 2012-10-27 19:56 3410人阅读评论(1) 收藏举报有四个线程1.2.3.4.线程1的功能就是输出1,线程2的功能就是输出2,以此类推.........现在有四个文件ABCD.初始都为空.现要让四个文件呈如下格式:A:1 2 3 4 1 2....B:2 3 4 1 2 3....C:3 4 1 2 3 4....D:4 1 2 3 4 1....请设计程序. [cpp] view plaincopy #include <stdio.h

C#四种文件流的区别

1.FileStream类的读写操作 FileStream类可以对任意类型的文件进行读取操作,而且我们也可以按照需要指定每一次读取字节长度,以此减少内存的消耗,提高读取效率. 代码实例: //创建文件读取对象 using(FileStream fileReader=new FileStream (文件的物理路径,FileMode.Open)) { //创建文件写入对象 using(FileStream fileWrite=new FileStream (需要保存的文件物理路径+文件后缀名,Fil

Linux more（功能类似 cat ，cat命令是整个文件的内容从上到下显示在屏幕上）

more命令,功能类似 cat ,cat命令是整个文件的内容从上到下显示在屏幕上. more会以一页一页的显示方便使用者逐页阅读,而最基本的指令就是按空白键(space)就往下一页显示,按 b 键就会往回(back)一页显示,而且还有搜寻字串的功能 .more命令从前向后读取文件,因此在启动时就加载整个文件. 1．命令格式: more [-dlfpcsu ] [-num ] [+/ pattern] [+ linenum] [file ... ] 2．命令功能: more命令和cat的功能一样都

多线程---有四个线程1、2、3、4。线程1的功能就是输出1，线程2的功能就是输出2，以此类推.........现在有四个文件ABCD

有四个线程1.2.3.4. 线程1的功能就是输出1, 线程2的功能就是输出2,以此类推---现在有四个文件ABCD. 初始都为空. 现要让四个文件呈如下格式: A:1 2 3 4 1 2-. B:2 3 4 1 2 3-. C:3 4 1 2 3 4-. D:4 1 2 3 4 1-. 请设计程序. 先试着写出四个线程交替写入A文件 public class FourThreadOneFile { public static FILE file = new FILE(); public stat

win32 汇编实现全盘文件扫描功能（杀毒程序的扫描全盘文件功能）

相信每一个玩过电脑的人都知道杀毒软件这个东西的存在(如果你不知道...那么我也没啥说的了汗..),每当我们的电脑出现卡顿或者中毒等情况的的时候,我们往往会进行一个全盘的文件扫描,对每个文件进行处理,包括校验该文件的各种属性,来确定该文件是否是垃圾文件或者是不安全文件,以前没有接触计算机内存管理的时候感觉当杀毒软件对全盘的文件进行扫描的时候,那种刷刷刷扫描文件的状态感觉很是强大(那时候还小对什么都好奇...),当学习完计算机内存管理的时候才算是有所了解,这个功能完全可以用很短的代码实现此功能,只不

在存放源程序的文件夹中建立一个子文件夹 myPackage。例如，在“D:\java”文件夹之中创建一个与包同名的子文件夹 myPackage（D:\java\myPackage）。在 myPackage 包中创建一个YMD类，该类具有计算今年的年份、可以输出一个带有年月日的字符串的功能。设计程序SY31.java，给定某人姓名和出生日期，计算该人年龄，并输出该人姓名、年龄、出生日期。程序使用YM

题目补充: 在存放源程序的文件夹中建立一个子文件夹 myPackage.例如,在"D:\java"文件夹之中创建一个与包同名的子文件夹 myPackage(D:\java\myPackage).在 myPackage 包中创建一个YMD类,该类具有计算今年的年份.可以输出一个带有年月日的字符串的功能.设计程序SY31.java,给定某人姓名和出生日期,计算该人年龄,并输出该人姓名.年龄.出生日期.程序使用YMD的方法来计算年龄. 主要考包的运用用到java.util.Calendar