bam(sam)2fasta

bam(sam)格式文件转化为fasta格式

bam2fasta的转变方式:
samtools view SL3003_SL3004_100122-hg18.bam | \
awk ‘{OFS="\t"; print ">"$1"\n"$10}‘ - > SL3003.fasta

sam2fasta的转变方式:
cat *.sam | awk ‘{print ">"$1"\n"$10}‘ > *.fasta

时间: 2024-08-01 17:14:22

bam(sam)2fasta的相关文章

sam/bam格式

一)Sam (Sequence Alignment/Map) ------------------------------------------------- 1) SAM 文件产生背景 随着Illumina/Solexa, AB/SOLiD and Roche/454测序技术不断的进步,各种比对工具产生,被用来高效的将reads比对到参考基因组.因为这些比对工具产生不同格式的文件,导致下游分析比较困难,因此一个通用的格式可以提供一个很好的接口用于链接比对与下游分析(组装,变异等,基因分型等)

samtools的基本用法

1.sam,bam的格式转换: $samtools view -sb file.sam >file.bam $samtools view -sb file.sam -o file.bam #sam文件转换为bam,-s 输入文件为sam -b 输出文件为bam $samtools view file.bam>file.sam$samtools view -h file.bam -o file.sam#bam文件转换为sam文件 2.对bam文件进行排序 $samtools sort -n fi

FastQC 测序质量

文章转载于 Original 2017-07-06 Jolvii 生信百科 介绍一下如何理解 FastQC 各模块的结果 FastQC 的使用 FastQC的安装介绍请看这里.FastQC 支持 fastq.gzip 压缩的 fastq.SAM.BAM 等格式,在不指定文件类型的情况下,FastQC 会根据文件的名字来推测文件的类型: 以 .sam 或者 .bam 结尾的文件会被当作 SAM/BAM 文件来打开,并统计 mapped 和 unmapped reads 在内的所有 reads:其它

用FastQC检查高通量测序原始数据的质量

本篇文章,主要参考了阳光1986的博文(http://www.dxy.cn/bbs/topic/31324367),自己测序的分析结果作为对比,加在其中了. 1.简介 当二代测序的原始数据拿到手之后,第一步要做的就是看一看原始reads的质量.常用的工具就是fastqc (http://www.bioinformatics.babraham.ac.uk/projects/fastqc/). fastqc的详细使用说明:http://www.bioinformatics.babraham.ac.u

[samtools] 文本查看语法,浏览SNP/INDEL位点

santools可以作为文本查看工具,查看比对结果文件,下面做一简单介绍: 1. 通过BWA比对获取sam比对文件,也可以将fastq文件转化为bam/sam文件: 2. 转换sam文件为bam文件,samtools view -bS seq.sam > seq.bam 3. 对bam文件进行排序,samtools sort seq.bam -o seq.sorted.bam 4. 对bam文件进行index,samtools index seq.sorted.bam 5. 查看比对结果文件,s

Quality assessment and quality control of NGS data

http://www.molecularevolution.org/resources/activities/QC_of_NGS_data_activity_new table of contents expected learning outcomes getting started exercise 1: checking Illumina data with the FASTX-Toolkit exercise 2: checking 454 data with the FASTX-Too

samtools和bcftools使用说明

转自:http://www.cnblogs.com/emanlee/p/4316581.html samtools是一个用于操作sam和bam文件的工具合集.包含有许多命令.以下是常用命令的介绍 1. view view命令的主要功能是:将sam文件转换成bam文件:然后对bam文件进行各种操作,比如数据的排序(不属于本命令的功能)和提取(这些操作 是对bam文件进行的,因而当输入为sam文件的时候,不能进行该操作):最后将排序或提取得到的数据输出为bam或sam(默认的)格式. bam文件优点

《生物信息学》——李霞;;生信概念

挑战:寻找新的处理海量数据和复杂性的方法. 生信:说了什么: 研究对象:       以核酸.蛋白质等生物大分子数据库 研究手段方法:数学.信息学.计算机科学 研究工具:       计算机硬件.软件.计算机网络 研究目的:       对浩如烟海的原始数据进行获取.加工.存储.分配.分析.管理.注释解释,使之成为具有明确生物意义的生物信息. 并通过生物信息的查询.搜索.比较.分析,从中获取基因编码.基因调控.核酸和pro结构功能及其相互关系等理性知识. 在大量信息和知识的基础上探索生命起源.生

生物大数据处理的一点心得

在生物领域中,常常处理gff,gtf,bam,sam等格式的文件.在此我总结了几点我处理这些文件的经验. 1.善用split分割每行,这些文件基本都是用tab分割的,所以有split分割非常方便,每行最后的注释信息一般都是;分割. 2.找出你所需要的列,并找出这列所有不同的元素.因为你拿到的文件可能之前就被处理过,具有很强的不确定性.比如你拿到了一个水稻的数据,你下意识的可能会认为染色体那列只有12种可能,但往往就是这种主观错误导致你的程序运行不了,因此在处理之前一定要弄清楚每列的元素. 3.将