项目数据:
- kongyu_131_PCRfree_.CCAAT_L006_R1_001.fastq.gz (100X)(19G)
kongyu_131_PCRfree_.CCAAT_L006_R2_001.fastq.gz (100X)(20G) - Y255_PCRfree_.TCCGC_L005_R1_001.fastq.gz (30X)(5.4G)
Y255_PCRfree_.TCCGC_L005_R2_001.fastq.gz (30X)(6.0G) - all.chrs.con.fasta (364M)
工具:
- BWA
- IGV
- SOAPdenovo
策略:
- 将测序的二代reads使用BWA比对到参考基因组,分成不同的窗口,按窗口进行局部组装,然后合并。
预备知识:
- 能用熟练使用 Perl 和 shell 写脚本
- 会熟练使用 PBS 提交任务
- BWA使用方法
- IGV使用方法
- SOAPdenovo使用方法
局部组装的问题:
已经有两批人没组出来了,局部组装大多不可能组装出完整的100K窗口,因为二代序列reads太短,重复序列太多,重复序列会导致连接中断,一个窗口会出现很多片段,而且也没有方法将其继续连接起来,所以他们都半途而废了。
后续可能会遇到的情况,必须借助后期的分析手段,将诸多片段连接成完整的序列。
杜发的文章,完全是在无参考基因组的情况下,denovo组装,利用多种手段,才将零碎的序列组装成完整的基因组。
老板懂得也不多,最大的贡献就是督促。
时间: 2024-10-07 07:24:10