项目一：使用二代数据进行基因组组装（局部组装和全局组装）

项目数据：

kongyu_131_PCRfree_.CCAAT_L006_R1_001.fastq.gz （100X）（19G）
kongyu_131_PCRfree_.CCAAT_L006_R2_001.fastq.gz （100X）（20G）
Y255_PCRfree_.TCCGC_L005_R1_001.fastq.gz （30X）（5.4G）
Y255_PCRfree_.TCCGC_L005_R2_001.fastq.gz （30X）（6.0G）
all.chrs.con.fasta （364M）

工具：

BWA
IGV
SOAPdenovo

策略：

将测序的二代reads使用BWA比对到参考基因组，分成不同的窗口，按窗口进行局部组装，然后合并。

预备知识：

能用熟练使用 Perl 和 shell 写脚本
会熟练使用 PBS 提交任务
BWA使用方法
IGV使用方法
SOAPdenovo使用方法

局部组装的问题：

已经有两批人没组出来了，局部组装大多不可能组装出完整的100K窗口，因为二代序列reads太短，重复序列太多，重复序列会导致连接中断，一个窗口会出现很多片段，而且也没有方法将其继续连接起来，所以他们都半途而废了。

后续可能会遇到的情况，必须借助后期的分析手段，将诸多片段连接成完整的序列。

杜发的文章，完全是在无参考基因组的情况下，denovo组装，利用多种手段，才将零碎的序列组装成完整的基因组。

老板懂得也不多，最大的贡献就是督促。

时间： 2024-10-07 07:24:10

项目一：使用二代数据进行基因组组装（局部组装和全局组装）的相关文章

性能测试项目总结－虚拟数据的准备

摘要:本文主要是面向性能测试的工程师,从实际项目中总结经验.教训,并且提出一些改善的建议,希望大家能在以后的性能测试的项目中吸取和借鉴,本文尤其在性能测试的前期数据准备方面给出了解决方案. 关键词:测试用例:性能测试:测试流程项目介绍该项目为两年前的一个项目,目前该系统的性能在一定的条件下速度极慢,当用户量达到一定程度时,整个程序会无法响应,所以需要对该项目进行性能测试,找到系统的瓶颈,为以后的系统升级做充分的准备. 项目延期的原因 XXX项目已经结束,在整个项目的测试过程中遇到了不少困难

项目架构开发：数据访问层之Query

接上文项目架构开发:数据访问层之Repository 上一章我们讲了IRepository接口,这张我们来讲IQuery 根据字面意思就可以知道,这次主要讲数据查询,上一章我们只针对单表做了查询的操作,多表联查并没有实现其实对于任何一个项目来说,多表联查都是比较麻烦的地方,因为项目的“读”操作,特别是多表的“读”,至少占据所有“读”的一半以上然而至今,据我所知还没有哪一款ORM工具可以灵活处理多表联查:想要不写sql语句,又想性能高,还想用强类型的ling查询方法:这对于多表查询来说比较难

关于项目中的DAL数据接入层架构设计

摘要:项目中对关系型数据库的接入再寻常不过,也有海量的ORM工具可供选择,一个一般性的DAL数据接入层的结构却大同小异,这里就分享一下使用Hibernate.Spring.Hessian这三大工具对DAL层的具体实现方法,也是对之前使用的一个总结. 关键词:Hibernate, Spring, Hessian, DAL, 数据接入层, 架构设计注意:以下配置或代码运行在Hibernate4.2.5,Spring3.2.4,Hessian4.0.37,Tomcat7.0.47环境下一.Mode

关于项目中批量修改数据

一.在项目中批量修改数据时应该写一条Update的Sql语句来执行,不能先将所要修改的数据筛选出来,然后再遍历修改. 原因: 1.这样只操作一次数据库,而后者需要操作无数次,性能很差. 2.绕圈子.需要修改数据时直接修改就行,不需要先全部查出来再逐条修改. 3.修改数据时时可以使用join的,例如: 1 update acc set acc.Creator = '滕晓梅' 2 from Accidents acc 3 inner join CompensationCase cc on acc.I

（项目实战）大数据Kafka原理剖析及（实战）演练视频教程

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程视频课程包含: 38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,Linux基础,Hadoop,Spark,Storm,Docker,Mapreduce,Kafka,Flume,OpenStack,Hiv

Android项目实战（二十三）：仿QQ设置App全局字体大小

原文:Android项目实战(二十三):仿QQ设置App全局字体大小一.项目需求: 因为产品对象用于中老年人,所以产品设计添加了APP全局字体调整大小功能. 这里仿做QQ设置字体大小的功能. QQ实现的效果是,滚动下面的seekbar,当只有seekbar到达某一个刻度的时候,这时候上部分的效果展示部分会改变文字大小, 但是在拖动过程中字体不会改变.关闭此界面,就可以看到改变文字后app整体的实际文字大小效果了. ----------------------------------------

使用DBG2OLC对二、三代数据进行基因组混装

使用DBG2OLC软件利用二代和三代数据混合的基因组组装: 使用DBG2OLC找Contigs序列和Pacbio reads的Overlap并进行Layout DBG2OLC通过比较contigs和Pacbio reads之间的overlap,将contigs序列定位到Pacbio reads上,将DBG的contigs结果运用到OLC算法中. 主要参数: LD 是否载入compressed reads information.第一次运行DBG2OLC命令的时候,该参数的值必须是0:若为了得到更

大数据技术之_18_大数据离线平台_01_项目开发流程+大数据常用应用/分析平台/业务处理方式+数据分析平台的数据来源+数据处理的流程+项目集群的规模+需求分析+技术架构/选型

一.项目开发流程1.1.项目调研1.2.项目需求分析1.3.方案设计1.3.1.概要设计1.3.2.详细设计1.4.编码实现1.4.1.单元测试1.4.2.集成测试1.4.3.压力测试1.4.4.用户测试二.大数据常用应用2.1.数据出售2.2.数据分析2.2.1.百度统计2.2.2.友盟2.2.3.其他统计分析组织2.3.搜索引擎2.3.1.solr2.3.2.luence2.3.3.luence & solr 对比2.4.推荐系统(高数)2.4.1.技术2.4.2.算法2.5.精准营销2.5

大数据技术之_26_交通状态预测项目_01_数据模拟 + 数据采集 + 数据建模 + 数据预测 + 项目总结

一项目背景二项目架构与环境2.1 项目架构2.2 项目环境三项目实现3.1 数据模拟3.1.1 数据结构3.1.2 编写代码3.1.3 测试3.2 数据采集3.2.1 编写代码3.2.2 测试3.3 数据建模3.3.1 编写代码3.3.2 测试3.4 数据预测3.4.1 编写代码3.4.2 测试四项目总结小段子分享:有个人姓铁,他不长头发,请问他得了什么病?答:老铁没毛病. 一项目背景该项目以车辆预测为基础,学习业务解决的方法论.学习完本项目后,可以解决如下问题或适用于如下业务场景