Redis中的键值对设计

丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样,DEV和DBA需要深度沟通,review每行sql语句,也不像memcached那样,不需要DBA的参与。redis的DBA需要熟悉数据结构,并能了解使用场景。

  下面举一些常见适合kv数据库的例子来谈谈键值的设计,并与关系型数据库做一个对比,发现关系型的不足之处。

  用户登录系统

  记录用户登录信息的一个系统, 我们简化业务后只留下一张表。

  关系型数据库的设计

mysql> select * from login;

+---------+----------------+-------------+---------------------+

| user_id | name           | login_times | last_login_time     |

+---------+----------------+-------------+---------------------+

|       1 | ken thompson   |           5 | 2011-01-01 00:00:00 |

|       2 | dennis ritchie |           1 | 2011-02-01 00:00:00 |

|       3 | Joe Armstrong  |           2 | 2011-03-01 00:00:00 |

+---------+----------------+-------------+---------------------+

  user_id表的主键,name表示用户名,login_times表示该用户的登录次数,每次用户登录后,login_times会自增,而last_login_time更新为当前时间。

  redis的设计

  关系型数据转化为KV数据库,我的方法如下:

  key 表名:主键值:列名

  value 列值

  一般使用冒号做分割符,这是不成文的规矩。比如在php-admin for redis系统里,就是默认以冒号分割,于是user:1 user:2等key会分成一组。于是以上的关系数据转化成kv数据后记录如下:

Set login:1:login_times 5

  Set login:2:login_times 1

  Set login:3:login_times 2

  Set login:1:last_login_time 2011-1-1

  Set login:2:last_login_time 2011-2-1

  Set login:3:last_login_time 2011-3-1

  set login:1:name ”ken thompson“

  set login:2:name “dennis ritchie”

  set login:3:name ”Joe Armstrong“

  这样在已知主键的情况下,通过get、set就可以获得或者修改用户的登录次数和最后登录时间和姓名。

  一般用户是无法知道自己的id的,只知道自己的用户名,所以还必须有一个从name到id的映射关系,这里的设计与上面的有所不同。

set "login:ken thompson:id" 1

  set "login:dennis ritchie:id" 2

  set "login: Joe Armstrong:id" 3

  这样每次用户登录的时候业务逻辑如下(python版),r是redis对象,name是已经获知的用户名。

#获得用户的id

  uid = r.get("login:%s:id" % name)

  #自增用户的登录次数

  ret = r.incr("login:%s:login_times" % uid)

  #更新该用户的最后登录时间

  ret = r.set("login:%s:last_login_time" % uid, datetime.datetime.now())

  如果需求仅仅是已知id,更新或者获取某个用户的最后登录时间,登录次数,关系型和kv数据库无啥区别。一个通过btree pk,一个通过hash,效果都很好。

  假设有如下需求,查找最近登录的N个用户。开发人员看看,还是比较简单的,一个sql搞定。

  

select * from login order by last_login_time desc limit N

  DBA了解需求后,考虑到以后表如果比较大,所以在last_login_time上建个索引。执行计划从索引leafblock 的最右边开始访问N条记录,再回表N次,效果很好。

  过了两天,又来一个需求,需要知道登录次数最多的人是谁。同样的关系型如何处理?DEV说简单

select * from login order by login_times desc limit N

  DBA一看,又要在login_time上建立一个索引。有没有觉得有点问题呢,表上每个字段上都有素引。

  关系型数据库的数据存储的的不灵活是问题的源头,数据仅有一种储存方法,那就是按行排列的堆表。统一的数据结构意味着你必须使用索引来改变sql的访问路径来快速访问某个列的,而访问路径的增加又意味着你必须使用统计信息来辅助,于是一大堆的问题就出现了。

  没有索引,没有统计计划,没有执行计划,这就是kv数据库。

  redis里如何满足以上的需求呢? 对于求最新的N条数据的需求,链表的后进后出的特点非常适合。我们在上面的登录代码之后添加一段代码,维护一个登录的链表,控制他的长度,使得里面永远保存的是最近的N个登录用户。

#把当前登录人添加到链表里

  ret = r.lpush("login:last_login_times", uid)

  #保持链表只有N位

  ret = redis.ltrim("login:last_login_times", 0, N-1)

  这样需要获得最新登录人的id,如下的代码即可

last_login_list = r.lrange("login:last_login_times", 0, N-1)

  另外,求登录次数最多的人,对于排序,积分榜这类需求,sorted set非常的适合,我们把用户和登录次数统一存储在一个sorted set里。

zadd login:login_times 5 1

  zadd login:login_times 1 2

  zadd login:login_times 2 3

  这样假如某个用户登录,额外维护一个sorted set,代码如此

#对该用户的登录次数自增1

  ret = r.zincrby("login:login_times", 1, uid)

  那么如何获得登录次数最多的用户呢,逆序排列取的排名第N的用户即可

ret = r.zrevrange("login:login_times", 0, N-1)

  可以看出,DEV需要添加2行代码,而DBA不需要考虑索引什么的。

  TAG系统

  tag在互联网应用里尤其多见,如果以传统的关系型数据库来设计有点不伦不类。我们以查找书的例子来看看redis在这方面的优势。

  关系型数据库的设计

  两张表,一张book的明细,一张tag表,表示每本的tag,一本书存在多个tag。

mysql> select * from book;

+------+-------------------------------+----------------+

| id   | name                          | author         |

+------+-------------------------------+----------------+

|    1 | The Ruby Programming Language | Mark Pilgrim   |

|    1 | Ruby on rail                  | David Flanagan |

|    1 | Programming Erlang            | Joe Armstrong  |

+------+-------------------------------+----------------+

mysql> select * from tag;

+---------+---------+

| tagname | book_id |

+---------+---------+

| ruby    |       1 |

| ruby    |       2 |

| web     |       2 |

| erlang  |       3 |

+---------+---------+

  假如有如此需求,查找即是ruby又是web方面的书籍,如果以关系型数据库会怎么处理?

select b.name, b.author from tag t1, tag t2, book b

  where t1.tagname = ‘web‘ and t2.tagname = ‘ruby‘ and t1.book_id = t2.book_id and b.id = t1.book_id

  tag表自关联2次再与book关联,这个sql还是比较复杂的,如果要求即ruby,但不是web方面的书籍呢?

  关系型数据其实并不太适合这些集合操作。

  redis的设计

  首先book的数据肯定要存储的,和上面一样。

set book:1:name ”The Ruby Programming Language”

  Set book:2:name ”Ruby on rail”

  Set book:3:name ”Programming Erlang”

  set book:1:author ”Mark Pilgrim”

  Set book:2:author ”David Flanagan”

  Set book:3:author ”Joe Armstrong”

  tag表我们使用集合来存储数据,因为集合擅长求交集、并集

sadd tag:ruby 1

  sadd tag:ruby 2

  sadd tag:web 2

  sadd tag:erlang 3

  那么,即属于ruby又属于web的书?

inter_list = redis.sinter("tag.web", "tag:ruby")

  即属于ruby,但不属于web的书?

inter_list = redis.sdiff("tag.ruby", "tag:web")

  属于ruby和属于web的书的合集?

inter_list = redis.sunion("tag.ruby", "tag:web")

  简单到不行阿。

  从以上2个例子可以看出在某些场景里,关系型数据库是不太适合的,你可能能够设计出满足需求的系统,但总是感觉的怪怪的,有种生搬硬套的感觉。

  尤其登录系统这个例子,频繁的为业务建立索引。放在一个复杂的系统里,ddl(创建索引)有可能改变执行计划。导致其它的sql采用不同的执行计划,业务复杂的老系统,这个问题是很难预估的,sql千奇百怪。要求DBA对这个系统里所有的sql都了解,这点太难了。这个问题在oracle里尤其严重,每个DBA估计都碰到过。对于MySQL这类系统,ddl又不方便(虽然现在有online ddl的方法)。碰到大表,DBA凌晨爬起来在业务低峰期操作,这事我没少干过。而这种需求放到redis里就很好处理,DBA仅仅对容量进行预估即可。

  未来的OLTP系统应该是kv和关系型的紧密结合。

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-10-21 17:16:12

Redis中的键值对设计的相关文章

浅谈REDIS数据库的键值设计(转)

add by zhj: 关系数据库表的一条记录可以映射成Redis中的一个hash类型,其实数据库记录本来就是键值对.这样,要比本文中的键设计用更少的键,更节省内存,因为每个键除了它的键值占用内存外,还额外占用一定的内存. 原文:http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣.不像关系型数据库那样,DEV和DBA需要深度沟通,review每行sql语句,也不像memcached那样,不需要DBA的参与.redis的D

浅谈REDIS数据库的键值设计

原文地址:http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣.不像关系型数据库那样,DEV和DBA需要深度沟通,review每行sql语句,也不像memcached那样,不需要DBA的参与.redis的DBA需要熟悉数据结构,并能了解使用场景. 下面举一些常见适合kv数据库的例子来谈谈键值的设计,并与关系型数据库做一个对比,发现关系型的不足之处. 用户登录系统 记录用户登录信息的一个系统, 我们简化业务后只留下一张表.

NSMutableDictionary 类中增加键值对方法分析

在iOS中可变字典增加一个键值对的方法有setObject: forKey: 和setValue : forKey: .为了方便我们把这两个方法简称为方法A和方法B. B这个方法中其中的value值是不能为nil,否则程序会出项崩溃.而A方法中的这个value可以为nil,但是当这个value位nil时,系统会自动调用removeObjectforKey:这个方法.这样就把这个键值对删除掉了.B方法中的key值可以是任意类型的,但是这个类型必须要实现NSCopying协议.而A方法中它的key值

PHP如何根据数组中的键值进行排序

主要是使用PHP的排序函数,asort()和arsort(). 为了减少代码的耦合性,我们将根据数组中的键值进行排序封装成一个函数 1 <?php 2 $array = array( 3 array('name'=>'aa','price'=>1050), 4 array('name'=>'bb','price'=>4300), 5 array('name'=>'cc','price'=>3100), 6 array('name'=>'dd','price'

如何在嵌入式产品中应用键值存储数据库

[ 声明:版权所有,欢迎转载,请勿用于商业用途. 联系信箱:[email protected]] 1.背景 随着互联网快速发展及大数据时代的到来,NoSQL数据库以其强大的可伸缩性.高效性.实时性等特点,而获得十足的发展.键值(Key-Value)存储数据库就是NoSQL的一种,大名鼎鼎的Redis就是一款用C开发的开源键值对存储数据库. 与此同时又有越来越多的厂家加入了IoT产品.可穿戴设备.智能家居的嵌入式产品开发行列中来,数据的持久化存储需求也就变得越来越多,选型一款伸缩性好.占用资源小.

怎样在嵌入式产品中应用键值存储数据库

[ 声明:版权全部.欢迎转载.请勿用于商业用途. 联系信箱:[email protected]] 1.背景 随着互联网高速发展及大数据时代的到来.NoSQL数据库以其强大的可伸缩性.高效性.实时性等特点,而获得十足的发展.键值(Key-Value)存储数据库就是NoSQL的一种,大名鼎鼎的Redis就是一款用C开发的开源键值对存储数据库. 与此同一时候又有越来越多的厂家增加了IoT产品.可穿戴设备.智能家居的嵌入式产品开发行列中来,数据的持久化存储需求也就变得越来越多,选型一款伸缩性好.占用资源

对GET/POST请求返回cookie中的键值对进行重新组合

get/post请求返回的cookie中并不是所有的键值对我们都需要,我们只需要提取我们需要的进行重新组合就可以了. 如下图是一个GET请求返回的cookie 我需要提取其中的 uin,skey等相关键值对. 以下函数可以完成我们的需要: //using System.Text.RegularExpressions; public string GetCookieByName(List<string> keylist, string cookie) { string str = "&

Spark中的键值对操作-scala

1.PairRDD介绍     Spark为包含键值对类型的RDD提供了一些专有的操作.这些RDD被称为PairRDD.PairRDD提供了并行操作各个键或跨节点重新进行数据分组的操作接口.例如,PairRDD提供了reduceByKey()方法,可以分别规约每个键对应的数据,还有join()方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD. 2.创建Pair RDD 程序示例:对一个英语单词组成的文本行,提取其中的第一个单词作为key,将整个句子作为value,建立 PairR

信号量,消息队列,共享内存中ket_t键值的生成函数ftok。

在System V中,我们经常用用key_t的值来创建或者打开信号量,共享内存和消息队列.这个在IPC的环境中十分的重要,比如说,服务器创建了一个消息队列,等待 客户机发送请求.那么如何创建或者打开已有的消息队列呢?一般而言,我们对于服务器使用的路径和项目id(proj_id)是已知的,所以客户机可以获取 相同的key来打开 消息队列并进行操作.下面就是ftok的使用原型: ftok函数   函数ftok把一个已存在的路径名和一个整数标识得转换成一个key_t值,称为IPC键: # includ