Est数据库

Est--编码序列，gene 片段且具有标签

其中，est数据库中是类似测序1、测序2、测序3这样的序列。实验室测得的序列是cDNA，通过上图方法拼接，电脑克隆（dbest）。如果有overlap则认为两个序列来自于同一个gene，overlap的碱基数目是40（不建议低于30，不建议高于40），过少容易拼接乱，过多对碱基突变的容忍性差。就一条序列来说，将比对后延长的结果进行二次比对，以此类推，直到不能延长为止。

est数据库的覆盖率超过95%。

先利用其他数据库（eg：引物数据库、末端数据库）过滤一遍。即因此在进行Contig电脑组装之前，需要探测并去除EST数据库中的污染序列。

拼接质检方法：Kozak规则，即第一个ATG侧翼序列的碱基分布所满足的统计规律，若将第一个ATG中的碱基A，T，G分别标为1，2，3位，则Kozak规则可描述如下：(1)第4位的偏好碱基为G；(2)ATG的5’端约15bp范围的侧翼序列内不含碱基T；(3)在-3，-6和-9位置。

挑战：

嵌合体问题：基因家族内的gene相似度高，电脑克隆的阈值不足以区分，miss之后将两个不同位置的gene弄混。这需要实验验证。嵌合体cDNA是指来源于不同基因的序列，由于偶然因素被组装在一起形成的Contig。我们构建的神经网络能探测组装过程形成的嵌合体。

发现SNP：对于某一个gene出现多个略有差别的序列，着多个序列中可能存在SNP。

利用何种数据库发现新基因？

基因组序列数据库和EST数据库。

发现原理是什么？

基因组序列数据库是识别，识别编码序列特征和非编码序列有何差异，有多种算法。

EST数据库是拼接，归属于同一gene的est拼接在一起，算法比较单一。

使用EST序列装载gene，可以帮助发现新gene、SNP、可变剪接和发现非编码RNA。

原文地址：https://www.cnblogs.com/yuanjingnan/p/11896670.html

时间： 2024-11-05 12:16:39

Est数据库的相关文章

生物信息学题目整理：陈润生

生物信息学题目整理: 陈润生: 一.什么是生物信息学?你怎么理解它的含义? Genome informatics is a scientific discipline that encompasses all aspects of genome information acquisition, processing, storage, distribution, analysis, and interpretation. 1.生物信息学是一个学科领域,包含着基因组信息的获取.处理.存储.分配 .

中科院生物信息学题目整理

1.什么是生物信息学,如何理解其含义? 答:生物信息学有三个方面的含义: 1) 生物信息学是一个学科领域,包含着基因组信息的获取.处理.存储.分配 .分析和解释的所有方面. 2) 生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质:同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测:其本质是识别基因信号. 3) 生物信息学的研究目标是揭示"基因组信息结构的复杂性及遗传语言的根本规律"

生信研究内容

目前生物信息学的研究情况来看,国际上公认的生物信息学的研究内容,大致包括以下几个方面: 1. 生物信息的收集.存储.管理与提供.包括建立国际基本生物信息库和生物信息传输的国际联网系统:建立生物信息数据质量的评估与检测系统:生物信息的在线服务:生物信息可视化和专家系统. 2. 基因组序列信息的提取和分析.包括基因的发现与鉴定,如利用国际EST 数据库 (dbEST) 和各自实验室测定的相应数据,经过大规模并行计算发现新基因和新SNPs以及各种功能位点:基因组中非编码区的信息结构分析,提出理

前段时间，接手一个项目使用的是原始的jdbc作为数据库的访问，发布到服务器上在运行了一段时间之后总是会出现无法访问的情况，登录到服务器，查看tomcat日志发现总是报如下的错误。　　 Caused by: com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException: Data source rejected est

前段时间,接手一个项目使用的是原始的jdbc作为数据库的访问,发布到服务器上在运行了一段时间之后总是会出现无法访问的情况,登录到服务器,查看tomcat日志发现总是报如下的错误. Caused by: com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException: Data source rejected establishment of connection, message from server: "Too man

Est数据库

Est数据库的相关文章

生物信息学题目整理：陈润生

中科院生物信息学题目整理

生信研究内容

探索Oracle之数据库升级二 11.2.0.3升级到11.2.0.4完整步骤

38、EST序列拼接流程

三.mail 接收权限 dovecot加密通信 php数据库 thunderbird

【数据库摘要】7_Sql_Outer_Join

SQLServer2008修改sa密码的方法与SQL server 2008数据库的备份与还原