seqtk 是一款针对fasta/fastq 文件进行处理的小程序,有很多的功能,速度很快,很方便;
源代码:https://github.com/lh3/seqtk
安装:
git clone https://github.com/lh3/seqtk
cd seqtk
make
测试:
seqtk seq : 用途:
1)将fastq 文件转换成fasta 文件
seqtk seq -A input.fastq > output.fasta
input.fastq的内容:
@NB001 ATGCACAAAACCCC + //////////////
output.fasta 的内容:
>NB001 ATGCACAAAACCCC
2)得到反向互补序列
seqtk seq -Ar input.fastq > output.fasta
output.fasta的内容为:
>NB001 GGGGTTTTGTGCAT
seqtk comp: 得到fastq/fasta 文件的碱基组成
seqtk comp input.fastq > out.txt
out.txt 的内容为:
NB001 14 6 6 1 1 0 0 0 0 0 0 0
第一列为序列的name; 第二列为长度,3-6列代表在该序列中A, C, G ,T 4中碱基的数目
用这个程序可以快速得到每条序列的长度
时间: 2024-10-12 03:03:51