一次数据库|二次数据库|

生物医学大数据-组学数据资源

困境:

经过human genome project之后得到了Book of life,但是测得base仅仅是生物信息学分析的开始,因为发现了数据的几个重要特点。首先是数据量过大,虽然科学家想通过不同组学角度(组学也随着数据量的增多层层细化和深入)来简化和系统解读过程,但是由于生物数据所对应的生物个体本身的结构复杂和高度特异,所以数据量的增大并没有带来数据质量的提升,反而提高了解读难度(eg,蛋白质结构相同但基因组不同的概率小,但是genome基数大,所以依据E=Np可知会造成很大的期望,数据挖掘能力下降)。此时得到的数据库便是一次数据库,功能是collection。

其中,生物体的结构复杂使得碱基序列不能以语言学上的方法处理,并没有固定的基本单位,每一层组学上都有其自身的一套系统。本质上也是因为语言本就是人造的规律,因而符合人的逻辑思维,而自然科学是完全客观的,研究人员需要学习和解读自然。

解决方法:

因此,我们提出二次数据库,主要是用来annotation,提升数据质量,本质上是利用多层面数据库的整合版本将已知的模式从原始数据中去除,对数据去冗余处理。(Eg,NCBI的RefSeq(打通ome)和Gene)

原文地址:https://www.cnblogs.com/yuanjingnan/p/11468594.html

时间: 2024-10-09 09:19:39

一次数据库|二次数据库|的相关文章

Python数据库(二)-Mysql数据库插入数据

通过python连接mysql数据库,并插入数据 # -*- coding:utf-8 -*- __author__ = "MuT6 Sch01aR" import pymysql conn = pymysql.connect(host='127.0.0.1',port=3306,user='root',passwd='root',db='niushop_b2c') cursor = conn.cursor() data = [ ('John','abcdef'), ('Jack','

【数据库】MySQL数据库(二)

一.数据库文件的导出 1.在DOS命令行下导出数据库(带数据) mysqldump -u root -p 数据库名 > E:\wamp\www\lamp175\lamp175.sql 2.在DOS命令行下导出数据表(带数据) mysqldump -u root -p 数据库名 数据表名 > E:\wamp\www\lamp175\lamp175_stu.sql 3.在DOS命令行下导出数据库(不带数据) mysqldump -u root -p -d 数据库名 > E:\wamp\www

JAVA使用JDBC连接MySQL数据库 二(2)

本文是对 <JAVA使用JDBC连接MySQL数据库 二>的改进. 上节使用的是PreparedStatement来执行数据库语句,但是preparedStatement需要传递一个sql语句参数,才能创建.然而,DBHelper类只是起到打开和关闭数据库的作用,所以sql语句是要放到应用层部分的,而不是放到DBHelper类中. 而statment不需要传递一个sql语句参数,就能创建. 修改部分如下: public class DBHelper { String driver = &quo

MyBatis系列二 之 数据库列名于程序实体类中字段名称不一致

MyBatis系列二  之   数据库列名于程序实体类中字段名称不一致 情景:当数据库中的列名与我们程序实体类中的字段名称不一致         使用ResultMap节点配置信息  在映射文件中  mapper根节点下配置ResultMap节点信息 <resultMap type="Student" id="studentMapper"> <result column="sname" property="stunam

面试提高及日常学习积累(二)——数据库篇

这一篇主要讲mysql的一些积累和学习体会. 一:数据库基础知识 Innodb引擎 Innodb引擎提供了对数据库ACID事务的支持,并且实现了SQL标准的四种隔离级别,关于数据库事务与其隔离级别的内容请见数据库事务与其隔离级别这篇文章.该引擎还提供了行级锁和外键约束,它的设计目标是处理大容量数据库系统,它本身其实就是基于MySQL后台的完整数据库系统,MySQL运行时Innodb会在内存中建立缓冲池,用于缓冲数据和索引.但是该引擎不支持FULLTEXT类型的索引,而且它没有保存表的行数,当SE

【MS SQL】数据库维护计划之数据库备份(二)

原文:[MS SQL]数据库维护计划之数据库备份(二) 上篇[MS SQL]数据库维护计划之数据库备份(一) 说了数据库备份的一些概念后,这篇以HRP_KQYY数据库备份为例,进行备份计划设置. 考虑备份的时间.性能和硬盘空间等因素,备份方案做下面设置: 1.每周日凌晨1:00执行数据库完成备份: 2.每周一至周六凌晨1:00执行数据库差异备份: 3.每天在00:00:00和23:59:59之间.每4小时执行数据库的日志备份. 建立3个文件夹: HRP_KQYY_diff:存放差异备份文件: H

二、数据库的基本操作

MySQL命令主要分为以下几类: DML:Data Manapulate Language: 数据操作语言(操作表中数据) INSERT, REPLACE, UPDATE, DELETE DDL:Data Defination Lanuage: 数据定义语言(操作表) CREATE, ALTER, DROP DCL:Data Control Language: 数据控制语言 GRANT, REVOKE DQL:Data Query Language:数据查询语言 SELECT,WHERE,ORD

(二)数据库基本术语

1.数据库 顾名思义,数据库DB (DataBase)即指存放数据的仓库,只不过该仓库位于计算机的存储设备上.通常,这些数据面向一个组织.部门或整个企业,它们是按照一定的数据组织模型存放在存储器上的一组相关数据集合.例如学生成绩管理系统中,学生的基本信息.学籍信息.成绩信息等都是来自学生成绩管理数据库的除了用户可以直接使用的数据外,还有另外一种数据.它们是有关数据库的定义信息,如数据库的名称.数据表的定义.数据库账户.权限等.这些数据用户不会经常性的使用,但是对数据库来说非常重要.这些数据通常存

MySQL学习笔记_12_Linux下C++/C连接MySQL数据库(二) --返回数据的SQL

 Linux下C++/C连接MySQL数据库(二) --返回数据的SQL 引: 返回数据的SQL是指通过查询语句从数据库中取出满足条件的数据记录 从MySQL数据库值哦功能检索数据有4个步骤: 1)发出查询 2)检索数据 3)处理数据 4)整理所需要的数据 用mysql_query()发出查询,检索数据可以使用mysql_store_result()或mysql_use_result(),取决与怎样检索数据,接着是调用mysql_fetch_row()来处理数据,最后,还必须调用mysql_