四类NoSQL数据库适用场景总结

键值数据库

适用案例

现在讲几个适合使用键值数据库的情况。

1 存触会话信息

通常来说,每一次网络会话都是唯一的,所以分配给它们的session id 值也各不相同。如果应用程序原来要把session id 存在磁盘上或关系型数据库中,那么将其迁移到键值数据库之后, 会获益良多, 因为全部会话内容都可以用一条PU T 请求来存放,而且只需一条GET 请求就能取得。由于会话中的所有信息都放在一个对象中,所以这种" 单请求操作" (single-request operation ) 很迅速。许多网络应用程序都使用像Memcached 这样的解决方案。如果"可用性" 较为重要,可使用Riak
.

2 用户配置信息

几乎每位用户都有userld 、usemame 或其他独特的属性, 而且其配置信息也各自独立, 诸如语言、颜色、时区、访问过的产品等。这些内容可全部放在一个对象里,以便只用一次GET 操作即获取某位用户的全部配置信息。同理,产品信息也可如此存放。

3 购物车数据

电子商务网站的用户都与其购物车相绑定。由于购物车的内容要在不同时间、不同浏览器、不同电脑、不同会话中保持一致,所以可把购物信息放在value 属性中,并将其绑定到userid 这个键名上。此类应用程序最宜使用Riak 集群了。

不适用场合

键值数据库在某些场合下并不是最佳方案。

1 数据间关系

如果要在不向数据集之间建立关系,或是将不同的关键字集合联系起来, 那么即使某些键值数据库提供了"链接遍历"等功能,它们也不是最佳选择了。

2 含有多项操作的事务

如果在保存多个键值对时,其中有一个关键字出错,而你又需要复原或回攘其余操作,那么键值数据库就不是最好的解决方案。

3 查询数据

如果要根据键值对的某部分值来搜寻关键字,那么键值数据库就不是很理想了。

我们无法直接检视键值数据库中的值,除非使用某些类似Riak Search 的产品或是像Lucene、Solr这样的"检索引擎" ( indexing engine) 。

4 操作关键字集合

由于键值数据库一次只能操作一个键,所以它无法同时操作多个关键字。假如需要操作多个关键字,那么最好在客户端处理此问题。

文档数据库

适用案例

1 事件记录

应用程序对事件记录各有需求。在企业级解决方案中,许多不同的应用程序都需要记录事件。文档数据库可以把所有这些不同类型的事件都存起来, 并作为事件存储的"中心数据库" (central data store) 使用。如果事件捕获的数据类型一直在变,那么就更应该用文档数据库了。可以按照触发事件的应用程序名"分片飞也可以按照order processed 或customer_logged e 等事件类型"分片"。

2 内容管理系统及博窑平台

由于文档数据库没有"预设模式" ( predefined schema) , 而且通常支持JSON 文挡,所以它们很适合用在"内容管理系统" (content management system ) 及网站发布程序上,也可以用来管理用户评论、用户注册、用户配景和面向Web 文档( web document ) 。

3 网站分析与实时分析

文档数据库可存储实时分析数据。由于可以只更新部分文档内容,所以用它来存储"页面浏览量" ( page view ) 或" 独立访客数" (unique v isitor ) 会非常方便,而且无需改变模式即可新增度量标准。

4 电子商务应用程序

电子商务类应用程序通常需要较为灵活的模式,以存储产品和订单。同时,它们也需要在不做高戚本数据库重构及数据迁移(参见1 2 .3 节)的前提下进化其数据模型。

不适用场合

某些场合文档数据库井非最佳方案。

1 包含多项操作的复杂事务

文档数据库也许不适合执行"跨文挡的原子操作" (atomic cross-document operation) ,然而像RavenDB 等文档数据库其实也支持此类操作。

2 查询持续变化的聚合结构

灵活的模式意味着数据库对模式不施加任何限制。数据以"应用程序实体"(application entity) 的形式存储。如果要即时查询这些持续改变的实体,那么所用的查询命令也得不停变化( 用关系型数据库的术语讲,就是:用JOIN 语句将数据表按查询标准连接起来时,待连接的表一直在变)。由于数据保存在聚合中, 所以假如聚合的设计持续变动,那么就需要以" 最低级别的粒度" ( lowest level of granularity ) 来保存聚合了, 这实际上就等于要统一数据格式了。在这种情况下,文档数据库也许不合适。

列族数据库

适用案例

现在讨论几个适合用列族数据库解决的问题。

1 事件记录

由于列族数据库可存放任意数据结构,所以它很适合用来保存应用程序状态或运行中遇到的错误等事件信息。在企业级环境下,所有应用程序都可以把事件写入Cassandra 数据库。它们可以用appname: timestamp (应用程序名: 时间戳〉作为行键,并使用自己需要的列。由于Cassa ndra 的写人能力可扩展,所以在事件记录系统中使用它效果会很好(参见图1 0 .2 )。

2 内容管理系统与博窑平台

使用列族,可以把博文的"标签" (tag) 、"类别" (catelog〉、"链接" ( link ) 和"mckback" 等属性放在不同的列中。评论信息既可以与上述内容放在同一行,也可以移到另一个"键空间"。同理,博客用户与实际博文亦可存于不同列族中。

3 计数器

在网络应用程序中,通常要统计某页面的访问人数并对其分类,以算出分析数据。

此时可使用CounterColum nType 来创建列族。

CREATE COLUMN FAMILY visit counter

WITH default_validation_class=CounterColumnType

AND key--va l Ida t lorIECla sszUTF8Type AND c。mpara t。r=UTF8Type J

创建好列族后,可以使用任意列记录网络应用程序中每个用户访问每一页面的次数。

INCR visit counter[ ‘mfowler ‘ 1 [home) BY 1 ;

INCR visit counter[ ‘mfow1er ‘] (products] BY 1 ;

I NCR visit counter[‘mfowler‘) (contactus) BY 1;

也可以用C QL 增加计数器的值:

UPDATE visi t counter SET home = home + 1 WHERE KEY= ‘mfowler ‘

4 限期使用

我们可能需要向用户提供试用版,或是在网站上将某个广告条显示一定时间。这

些功能可以通过" 带过期时限的列" ( expiring column ) 来完成。这种列过了给定时限后,就会由Cassandra 自动删除。这个时限叫做TTL (Time To Live ,生存时间),以秒为单位。经过TTL 指定的时长后,这种列就被删掉了。程序若检测到此列不存在,则可收回用户访问权限或移除广告条。

SET Customer( ‘ mfowler ‘ ) ( ‘ demo access ‘ ) = ‘ allowed ‘ WITH ttl=2592000;

不适用场合

有些问题用列族数据库来解决并不是最佳选择,例如需要以" ACID 事务"执行写人及读取操作的系统。如果想让数据库根据查询结果来聚合数据( 例如SUM (求和〉或AVG ( 求平均值) ) , 那么得把每一行数据都读到客户端, 并在此执行操作。在开发早期原型或刚开始试探某个技术方案时,不太适合用Cassandra. 开发初期无法确定查询模式的变化情况,而查询模式一旦改变,列族的设计也要随之修改。这将阻碍产品创新团队的工作并降低开发者的生产能力。在关系型数据库中,数据模式的修改成本很高,而这却降低了查询模式的修改成本;
Cassandra 则与之相反,改变其查询模式要比改变其数据模式代价更高。

图数据库

适用案例

接下来讲一些适合使用图数据库的用例。

1 互联数据

部署并使用图数据库来处理社交网络非常高效。社交图里并不是只能有"朋友"这种关系,例如也可以用它们表示雇员、雇员的学识, 以及这些雇员与其他雇员在不同项目中的工作位置。任何富含链接关系的领域都很适合用图数据库表示。假如同一个数据库含有不同领域(像社交领域、空间领域、商务领域等)的领域实体,而这些实体之间又有关系,那么图数据库提供的跨领域遍历功能,可以让这些关系变得更有价值。

.2 安排运输路线、分派货物和基于位置的服务

投递过程中的每个地点或地址都是一个节点, 可以把送货员投递货物时所经全部节点建模为一张节点图。节点间关系可带有距离属性,以便高效投递货物。距离与位置属性也可用在名胜图(graph of places of interest ) 中, 这样应用程序就可向用户推荐其附近的好餐馆及娱乐场所了。还可将书店、餐馆等销售点( point of sales) 做成节点, 当用户靠近时通知他们,以提供基于位置的服务。

3 推荐引擎

在系统中创建节点与关系时, 可以用它们为客户推荐信息,例如"您的朋友也买了这件产品"或"给这些货品开发票时,通常也要为那些货品一并开票"。还可以用它们向旅行者提议: 来巴塞罗那旅游的人一般都会去看看安东尼· 高迪@ 所设计的建筑。用图数据库推荐信息时,有个副作用值得注意: 随着数据量变多,推荐信息所用的节点及关系数也激增。同一份数据可以挖掘出不同信息。例如,既可以从中看出客户总是将其与哪些产品一并购买,也可以查出与此产品一并开发票的其余产品。若两者不匹配,则可发出警示。因数据库与其他" 推荐引擎" (
recommendation engine ) 一样,也可以根据关系间的模式侦测交易欺诈( fraud in transaction ) 。

不适用场合

图数据库在某些情形下也许不适用。在更新全部或某子集内的实体时就是这样。比如,在某个" 数据分析解决方案" (analytics solution ) 中, 只要一个属性变了,全部实体就都得更新。此时图数据库的效果就不理想了,因为投有哪个简单的操作能一次性改变所有节点中的某个属性。即便数据模型适合问题领域, 某些图数据库可能也无法处理那么大的数据盘, 尤其在执行"全局图操作" (global graph operation,涉及整张图的操作)时更是如此。

时间: 2024-10-08 16:05:52

四类NoSQL数据库适用场景总结的相关文章

四大类NoSQL数据库

原文:http://blog.monitis.com/index.php/2011/05/22/picking-the-right-nosql-database-tool/ nosql学习网站推荐: http://nosql-database.org/ http://blog.nosqlfan.com/ 1.key-value存储 Examples Tokyo Cabinet/Tyrant, Redis, Voldemort, Oracle BDB 典型应用场景 内容缓存,主要用于处理大量数据的

Mysql数据库理论基础之九---四类隔离级别

一.简介 由MySQL AB公司开发,是最流行的开放源码SQL数据库管理系统,主要特点: 1.是一种数据库管理系统 2.是一种关联数据库管理系统 3.是一种开放源码软件,且有大量可用的共享MySQL软件 4.MySQL数据库服务器具有快速.可靠和易于使用的特点 5.MySQL服务器工作在客户端/服务器模式下,或嵌入式系统中 InnoDB存储引擎将InnoDB表保存在一个表空间内,该表空间可由数个文件创建.这样,表的大小就能超过单独文件的最大容量.表空间可包括原始磁盘分区,从而使得很大的表成为可能

NoSQL 数据库概览及其与 SQL 语法的比较

NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用的难题. 本文对NoSQL数据库的定义.分类.特征.当前比较流行的NoSQL数据库系统等进行了简单的介绍,并对NoSQL和SQL语法进行了简单的比较,为大家对NoSQL数据库的学习提供了有益的参考. 一.NoSQL的出现 关系型数据库系统多年来在解决数据存储.服务和处理问题方面取得了巨大的成功.一些大型的公司使用关系型数据库建立了自己的系统,如联机事务处理系统和后端分析应用系统.联机事务处理(OLTP)系统用

15个nosql数据库

1.MongoDB 介绍 MongoDB是一个基于分布式文件存储的数据库.由C++语言编写.主要解决的是海量数据的访问效率问题,为WEB应用提供可扩展的高性能数据存储解决方案.当数据量达到50GB以上的时候,MongoDB的数据库访问速度是MySQL的10倍以上.MongoDB的并发读写效率不是特别出色,根据官方提供的性能测试表明,大约每秒可以处理0.5万~1.5万次读写请求.MongoDB还自带了一个出色的分布式文件系统GridFS,可以支持海量的数据存储. MongoDB也有一个Ruby的项

转:有事务处理的NoSQL数据库

原文来自于:http://www.infoq.com/cn/articles/MarkLogic-NoSQL-with-Transactions Java平台在其几乎整个生命周期中,都在煞费苦心地努力将数据库持久化功能无缝提供给开发人员.你是否已经尝试了早期的JDBC规范.EJB.O/R映射如Hibernate,或者最近的JPA规范,这一路上你不太可能没有遇到过关系型数据库.也许很可能你已经明白了面向对象建模与关系型数据库如何存储数据的区别(有时候开发人员称之为阻抗不匹配). 然而最近,NoSQ

HBase与MongDB等NoSQL数据库对比

转载请注明出处: jiq?钦's technical Blog - 季义钦 一.开篇 淘宝之前使用的存储层架构一直是MySQL数据库,配合以MongDB,Tair等存储. MySQL由于开源,并且生态系统良好,本身拥有分库分表等多种解决方案,因此很长一段时间内都满足淘宝大量业务的需求.但是由于业务的多样化发展,有越来越多的业务系统的需求开始发生了变化.一般来说有以下几类变化: (1)    数据量变得越来越多,事实上现在淘宝几乎任何一个与用户相关的在线业务的数据量都在亿级别,每日系统调用次数从亿

NoSQL数据库介绍(2)

2 NoSQL潮流 在这一章中,将一起讨论NoSQL潮流的动机和主要驱动力,以及NoSQL主张的批评和反馈.本章将通过不同的尝试得出结论来分类和描述NoSQL数据库.其中一个分类法将在随后的章节中被提出. 2.1 动机和主要驱动力 NoSQL这个词汇首先用在1998年对关系数据库排除SQL使用的论文([ Str10 ]).这个词在2009年再次被选出来,并用于非关系数据库拥护者(如Last.fm的开发者Jon Oskarsson,他组织了三藩的NoSQL见面会)的会议([ Eva09a ]).一

开源软件:NoSql数据库 - 图数据库 Neo4j

转载自原文地址:http://www.cnblogs.com/loveis715/p/5277051.html 最近我在用图形数据库来完成对一个初创项目的支持.在使用过程中觉得这种图形数据库实际上挺有意思的.因此在这里给大家做一个简单的介绍. NoSQL数据库相信大家都听说过.它们常常可以用来处理传统的关系型数据库所难以解决的一系列问题.通常情况下,这些NoSQL数据库分为Graph,Document,Column Family以及Key-Value Store等四种.这四种类型的数据库分别使用

HBase与MongDB等NoSQL数据库对照

HBase概念学习(十)HBase与MongDB等NoSQL数据库对照 转载请注明出处: jiq?钦's technical Blog - 季义钦 一.开篇 淘宝之前使用的存储层架构一直是MySQL数据库,配合以MongDB,Tair等存储. MySQL因为开源,而且生态系统良好,本身拥有分库分表等多种解决方式,因此非常长一段时间内都满足淘宝大量业务的需求.可是因为业务的多样化发展,有越来越多的业务系统的需求開始发生了变化.一般来说有下面几类变化: (1)    数据量变得越来越多,其实如今淘宝