NoSQL--非关系型的数据库是什么?

NoSQL,指的是非关系型的数据库。NoSQL,意即反SQL运动,是一项全新的数据库革命性运动,早期就有人提出,发展至2009年趋势越发高涨。NoSQL的拥护者们提倡运用非关系型的数据存储,相对于目前铺天盖地的关系型数据库运用,这一概念

NoSQL,指的是非关系型的数据库。NoSQL,意即反SQL运动,是一项全新的数据库革命性运动,早期就有人提出,发展至2009年趋势越发高涨。NoSQL的拥护者们提倡运用非关系型的数据存储,相对于目前铺天盖地的关系型数据库运用,这一概念无疑是一种全新的思维的注入。
反SQL运动的主要倡导者都是Web和
Java开发者,他们中许多人都在创业的初期历经了资金短缺并因此与Oracle说再见,然后效仿Google
和Amazon的道路建设起自己的数据存储解决方案 ,并随后将自己的成果开源
发布。现在,他们的开源数据商店管理 着成百TB甚至PB的数据,由于Web 2.0和云计算的兴起,无论从技术
上还是从经济上他们都无需再返回从前,甚至连想也不用想。
“Web
2.0的企业应该抓住机会,他们需要可扩展性,”总部设在伦敦的NoSQL会议组织者Johan
Oskarsson说,他任职于著名的音乐网站Last.fm,其他的大多数与会者也都是网络
开发者。
Oskarsson说,许多人甚至抛弃了MySQL开源数据库这个长期以来Web
2.0的宠儿,而改由NoSQL的方案来替代,因为优势实在是引人注目。51CTO.com之前曾报道过MySQL创始人宣布创建开源数据库联盟的消息,过度的商业化是MySQL失去原来的优势。
例如Facebook建立了自己的Cassandra数据商店并且在其网站上重点推出一项新的搜索功能
,没有使用 到现有的MySQL数据库。据Facebook的工程师Avinash
Lakshma介绍,Cassandra仅用0.12毫秒就可以写入50GB的数据,比MySQL快了超过2500倍。Google也开始公测他们的云数据库Fusion
Tables,这是一个和传统数据库完全不同的数据库,主要优势能够简单的解决关系型数据库中管理不同类型数据麻烦,以及排序
整合的常见操作的性能问题等。

 随着互联网web2.0网站的兴起,非关系型的数据库现在成了一个极其热门的新领域,非关系数据库产品的发展非常迅速。而传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,例如:

1、High performance - 对数据库高并发读写的需求

web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到每秒上万次读写请求。关系数据库应付上万次SQL查询还勉强顶得住,但是应付上万次SQL写数据请求,硬盘
IO就已经无法承受了。其实对于普通的BBS网站,往往也存在对高并发写请求的需求。

2、Huge Storage - 对海量数据的高效率存储和访问的需求

对于大型的SNS网站,每天用户产生海量的用户动态,以国外的Friendfeed为例,一个月就达到了2.5亿条用户动态,对于关系数据库来说,在一张2.5亿条记录的表里面进行SQL查询,效率是极其低下乃至不可忍受的。再例如大型web网站的用户登录系统
,例如腾讯,盛大,动辄数以亿计的帐号,关系数据库也很难应付。

3、High Scalability && High Availability-
对数据库的高可扩展性和高可用性的需求

在基于web的架构当中,数据库是最难进行横向
扩展的,当一个应用系统的用户量和访问量与日俱增的时候,你的数据库却没有办法像web server 和app
server那样简单的通过添加 更多的硬件
和服务节点来扩展性能和负载能力。对于很多需要提供24小时不间断服务的网站来说,对数据库系统进行升级
和扩展是非常痛苦的事情,往往需要停机维护和数据迁移,为什么数据库不能 通过不断的添加服务器
节点来实现扩展呢?

在上面提到的“三高”需求面前,关系数据库遇到了难以克服的障碍,而对于web2.0网站来说,关系数据库的很多主要特性却往往无用武之地,例如:

1、数据库事务一致性需求

很多web实时系统并不要求严格的数据库事务,对读一致性的要求很低,有些场合对写一致性要求也不高。因此数据库事务管理成了数据库高负载下一个沉重的负担。

2、数据库的写实时性和读实时性需求

对关系数据库来说,插入一条数据之后立刻查询,是肯定可以读出来这条数据的,但是对于很多web应用来说,并不要求这么高的实时性。

3、对复杂的SQL查询,特别是多表关联查询的需求

任何大数据量的web系统,都非常忌讳多个大表的关联查询,以及复杂的数据分析类型的复杂SQL报表查询,特别是SNS类型的网站,从需求以及产品设计角度,就避免了这种情况的产生。往往更多的只是单表的主键查询,以及单表的简单条件分页查询,SQL的功能被极大的弱化了。

因此,关系数据库在这些越来越多的应用场景下显得不那么合适了,为了解决这类问题的非关系数据库应运而生,现在这两年,各种各样非关系数据库,特别是键值数据库(Key-Value
Store DB)风起云涌,多得让人眼花缭乱。前不久国外刚刚举办了NoSQL
Conference,各路NoSQL数据库纷纷亮相,加上未亮相但是名声在外的,起码有超过10个开源的NoSQLDB,例如:

Redis,Tokyo
Cabinet,Cassandra,Voldemort,MongoDB,Dynomite,HBase,CouchDB,Hypertable, Riak,Tin,
Flare, Lightcloud, KiokuDB,Scalaris, Kai, ThruDB, ......

这些NoSQL数据库,有的是用C/C++编写的,有的是用Java编写的,还有的是用Erlang编写的,每个都有自己的独到之处。

NoSQL
是非关系型数据存储的广义定义。它打破了长久以来关系型数据库与ACID理论大一统的局面。NoSQL 数据存储不需要固定的表结构
,通常也不存在连接操作。在大数据存取上具备关系型数据库无法比拟的性能优势。该术语 在 2009 年初得到了广泛认同。

  当今的应用体系结构需要数据存储在横向伸缩性上能够满足需求。而 NoSQL 存储就是为了实现这个需求。Google
的BigTable与Amazon的Dynamo是非常成功的商业 NoSQL 实现。一些开源的 NoSQL 体系,如Facebook
的Cassandra, Apache
 的HBase,也得到了广泛认同。从这些NoSQL项目的名字上看不出什么相同之处:Hadoop、Voldemort、Dynomite,还有其它很多。

  如果您刚接触
NoSQL,那有必要学习一些背景知识。下列资料是国外一前沿技术分析师  认为非常有价值的 NoSQL
相关必读资料:

  1. IE R5bmFtbyDorrrmloc="
    href="http://s3.amazonaws.com/AllThingsDistributed/sosp/amazon-dynamo-sosp2007.pdf">Amazon
    Dynamo 论文 。几乎所有懂 NoSQL 的人都阅读过它。

  2. Google 的 html">Bigtable 论文 。 也许您已经耳熟能详。

  3. Werner Vogels 的 “Eventually Consistent”
     (发布于 ACM Queue
     )。如果您对“最终一致性  ”不是非常清晰,请阅读这篇文章。

  4. Brewer 的 CAP 理论
     (可伸缩性的基础)在这里 可以找到非常好的诠释。也可以看看 2000 7 月 PODC
    上 Brewer的原始幻灯片  。

  5. sql -debrief.html">在 2009 年 6 月在 SFO 的 NoSQL 见面会的幻灯片
    。这些资料可以用经典的、关键的、将影响巨大的、值得纪念的来形容。

  6. SQL Databases Don‘t Scale
     是一篇简短、基础、直切问题的文章。除非您是一位在伸缩性问题
     上身经百战的数据库管理员 ,否则,这篇文章讲述的内容对于您可能是非常关键的。

  7. Jonathan Ellis  的文章 NoSQL Ecosystem
     以表格的方式对当今主流的分布式数据库  做了比较。类似的比较还有 Quick
    Reference to Alternative data storages  。Ellis 的文章除了表格对比外对于想了解
    NoSQL 生态的人来说是非常值得一读的,该文章内涵丰富,短小精悍;而 Quick Reference to Alternative
    data storages  主要是表格,这些表格对比的内容又比 Ellis 的完整。

相关国外资源

http://nosql-databases.org
 —— 该站点的标语是:“非关系型世界的终结向导!”,该站点非常确信自己是:“在互联网上拥有 NoSQL
相关链接最多的网站。”总之,该网站值得关注。
     另外,作为 NoSQL 极客(geeks),请
follow @nosqlupdate  。另外,请
follow @al3xandru (MyNoSQL blog
 与 NoSQL Week in Review  的创建者)。NoSQL Week in
Review  比较新,希望能保持正常更新,因为它确实很棒!
    
当然,您还可以看看 Ricky Ho 最近的博文,他总结了一些分布式数据存储技术关键点。他的博文中有两篇非常值得一看的文章:Query
Processing for NoSQL Databases  ,还有 NoSQL Design
Patterns  。

相关国内资源


时间: 2024-10-11 12:04:32

NoSQL--非关系型的数据库是什么?的相关文章

NoSQL 非关系型的数据库

关系型数据库的缺点: 随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,例如: 1.High performance - 对数据库高并发读写的需求 web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到每秒上万次读写请求.关系数据库应付上万次SQL查询还勉强顶得住,但是应付上万次SQ

SQL与NoSQL(关系型与非关系型)数据库的区别

永远正确的经典答案依然是:具体问题具体分析. 数据表VS.数据集 关系型和非关系型数据库的主要差异是数据存储的方式.关系型数据天然就是表格式的,因此存储在数据表的行和列中.数据表可以彼此关联协作存储,也很容易提取数据.与其相反,非关系型数据不适合存储在数据表的行和列中,而是大块组合在一起.非关系型数据通常存储在数据集中,就像文档.键值对或者图结构.你的数据及其特性是选择数据存储和提取方式的首要影响因素. 预定义结构VS.动态结构 关系型数据通常对应于结构化数据,因为数据表都有预定义好的结构(列的

数据库大师成长日记:您最需要了解的NoSQL非关系型数据库

朋友们,我们平时使用的数据库,大多都是关系型数据库,包括MySQL.PostgreSQL.SQLServer等.关系型数据库的特点是数据的存储通过二维表格实现,将数据存储在相互独立的表格中. 近年来,随着互联网的飞速发展,数据的形态发生了很大改变,非关系型数据库NoSQL应运而生.越来越流行.NoSQL主要包括键值(Key-Value)存储数据库.列存储(Column-oriedted)数据库.面向文档(Document-Oriented)数据库.图形(Graph)数据库四种,下面介绍三款最常用

非关系型的数据库NoSQL

NoSQL的总体介绍 http://www.apelearn.com/bbs/forum.php?mod=viewthread&tid=8660&highlight=NoSQL memcached介绍 1.3 memcached安装 http://www.apelearn.com/bbs/thread-9285-1-1.html yum install -y epel-release rpm -qa epel-release yum install -y livevent memcache

NoSQL 与 关系型数据库

一.二者的基本概念 NoSQL,泛指非关系型的数据库. 关系数据库,是建立在关系模型基础上的数据库. 这里提到了关系模型, 关系模型是1970年由E.F.Codd提出的. 它和层次.网状模型相比,有以下特点: 1.数据结构简单(二维表格) 2.扎实的理论基础. a.关系运算理论 b.关系模式设计理论 简单来说,关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织. 对于NoSQL并没有一个明确的范围和定义,但是他们都普遍存在下面一些共同特征: 不需要预定

Python3网络爬虫实战-33、数据存储:非关系型数据库存储:MongoDB

NoSQL,全称 Not Only SQL,意为不仅仅是 SQL,泛指非关系型的数据库.NoSQL 是基于键值对的,而且不需要经过 SQL 层的解析,数据之间没有耦合性,性能非常高. 非关系型数据库又可以细分如下: 键值存储数据库,代表有 Redis, Voldemort, Oracle BDB 等. 列存储数据库,代表有 Cassandra, HBase, Riak 等. 文档型数据库,代表有 CouchDB, MongoDB 等. 图形数据库,代表有 Neo4J, InfoGrid, Inf

关系型数据库与非关系型数据库区别

关系型数据库(Mysql和Oracle) 1.表和表.表和字段.数据和数据存在着关系 优点: 1.数据之间有关系,进行数据的增删改查的时候是非常方便的 2.关系型数据库是有事务操作的,保证数据的完整性和一致性. 缺点: 1.因为数据和数据是有关系的,底层是运行了大量的算法,大量算法会降低系统的效率,会降低性能 2.面对海量数据的增删改查的时候会显的无能为力 3.海量数据对数据进行维护变得非常的无力 常见应用: 适合处理一般量级的数据(银行转账和钱) 非关系数据库的(redis和MangDB) 为

NoSQL:从关系型数据库到非关系型数据库

关系型数据库 所谓关系型数据库,,就是指采用了关系模型来组织数据的数据库. 什么是关系模型,简单说,关系模型就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织. 关系模型中常用的概念: 1.关系 可以理解为一张二维表,每个关系都有一个关系名,在数据库中被称为表名 2.元组 可以理解为二维表中的一行,在数据库中被称为记录 3.属性 可以理解为二维表中的一列,在数据库中被称为字段 4.域 属性的取值范围,在数据库中为某一列的取值限制 5.关键字 一族可以唯一标识元组的

非关系型数据库NoSQL

NoSQL(not only sql)非关系型数据库 一.关系型数据库与非关系型数据库对比: 常见的关系型数据库:MySQL.Oracle.SqlServer 关系型数据库涉及联合查询(join),数据量大的时候查询会锁表变慢 NoSQL数据之间无关系,可以随意扩展 NoSQL数据存储简单,而且可以存在内存中,所以读写速度非常快,即使数据量很大也很快 NoSQL不需要建立表.字段等数据,他可以随时存储自定义的格式,而关系型数据库增.改字段非常麻烦,尤其是数据量非常大的情况下,就更麻烦 二.常见的