`
m635674608
  • 浏览: 4939902 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

Redis键值设计

 
阅读更多

丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样,DEV和DBA需要深度沟通,review每行sql语句,也不像memcached那样,不需要DBA的参与。redis的DBA需要熟悉数据结构,并能了解使用场景。

下面举一些常见适合kv数据库的例子来谈谈键值的设计,并与关系型数据库做一个对比,发现关系型的不足之处。

用户登录系统

记录用户登录信息的一个系统, 我们简化业务后只留下一张表。

关系型数据库的设计

mysql> select * from login;
+---------+----------------+-------------+---------------------+
| user_id | name           | login_times | last_login_time     |
+---------+----------------+-------------+---------------------+
|       1 | ken thompson   |           5 | 2011-01-01 00:00:00 |
|       2 | dennis ritchie |           1 | 2011-02-01 00:00:00 |
|       3 | Joe Armstrong  |           2 | 2011-03-01 00:00:00 |
+---------+----------------+-------------+---------------------+

user_id表的主键,name表示用户名,login_times表示该用户的登录次数,每次用户登录后,login_times会自增,而last_login_time更新为当前时间。

REDIS的设计

关系型数据转化为KV数据库,我的方法如下:

key 表名:主键值:列名

value 列值

一般使用冒号做分割符,这是不成文的规矩。比如在php-admin for redis系统里,就是默认以冒号分割,于是user:1 user:2等key会分成一组。于是以上的关系数据转化成kv数据后记录如下:

Set login:1:login_times 5
Set login:2:login_times 1
Set login:3:login_times 2

Set login:1:last_login_time 2011-1-1
Set login:2:last_login_time 2011-2-1
Set login:3:last_login_time 2011-3-1

set login:1:name ”ken thompson“
set login:2:name “dennis ritchie”
set login:3:name ”Joe Armstrong“

这样在已知主键的情况下,通过get、set就可以获得或者修改用户的登录次数和最后登录时间和姓名。

一般用户是无法知道自己的id的,只知道自己的用户名,所以还必须有一个从name到id的映射关系,这里的设计与上面的有所不同。

set "login:ken thompson:id"      1
set "login:dennis ritchie:id"    2
set "login: Joe Armstrong:id"    3

这样每次用户登录的时候业务逻辑如下(python版),r是redis对象,name是已经获知的用户名。

1 #获得用户的id
2 uid = r.get("login:%s:id" % name)
3 #自增用户的登录次数
4 ret = r.incr("login:%s:login_times" % uid)
5 #更新该用户的最后登录时间
6 ret = r.set("login:%s:last_login_time" % uid, datetime.datetime.now())

如果需求仅仅是已知id,更新或者获取某个用户的最后登录时间,登录次数,关系型和kv数据库无啥区别。一个通过btree pk,一个通过hash,效果都很好。

假设有如下需求,查找最近登录的N个用户。开发人员看看,还是比较简单的,一个sql搞定。

1 select from login order by last_login_time desc limit N

DBA了解需求后,考虑到以后表如果比较大,所以在last_login_time上建个索引。执行计划从索引leafblock 的最右边开始访问N条记录,再回表N次,效果很好。

过了两天,又来一个需求,需要知道登录次数最多的人是谁。同样的关系型如何处理?DEV说简单

1 select from login order by login_times desc limit N

DBA一看,又要在login_time上建立一个索引。有没有觉得有点问题呢,表上每个字段上都有素引。

关系型数据库的数据存储的的不灵活是问题的源头,数据仅有一种储存方法,那就是按行排列的堆表。统一的数据结构意味着你必须使用索引来改变sql的访问路径来快速访问某个列的,而访问路径的增加又意味着你必须使用统计信息来辅助,于是一大堆的问题就出现了。

没有索引,没有统计计划,没有执行计划,这就是kv数据库。

redis里如何满足以上的需求呢? 对于求最新的N条数据的需求,链表的后进后出的特点非常适合。我们在上面的登录代码之后添加一段代码,维护一个登录的链表,控制他的长度,使得里面永远保存的是最近的N个登录用户。

1 #把当前登录人添加到链表里
2 ret = r.lpush("login:last_login_times", uid)
3 #保持链表只有N位
4 ret = redis.ltrim("login:last_login_times"0, N-1)

这样需要获得最新登录人的id,如下的代码即可

1 last_login_list = r.lrange("login:last_login_times"0, N-1)

另外,求登录次数最多的人,对于排序,积分榜这类需求,sorted set非常的适合,我们把用户和登录次数统一存储在一个sorted set里。

zadd login:login_times 5 1
zadd login:login_times 1 2
zadd login:login_times 2 3

这样假如某个用户登录,额外维护一个sorted set,代码如此

1 #对该用户的登录次数自增1
2 ret = r.zincrby("login:login_times"1, uid)

那么如何获得登录次数最多的用户呢,逆序排列取的排名第N的用户即可

1 ret = r.zrevrange("login:login_times"0, N-1)

可以看出,DEV需要添加2行代码,而DBA不需要考虑索引什么的。

TAG系统

tag在互联网应用里尤其多见,如果以传统的关系型数据库来设计有点不伦不类。我们以查找书的例子来看看redis在这方面的优势。

关系型数据库的设计

两张表,一张book的明细,一张tag表,表示每本的tag,一本书存在多个tag。

mysql> select * from book;
+------+-------------------------------+----------------+
| id   | name                          | author         |
+------+-------------------------------+----------------+
|    1 | The Ruby Programming Language | Mark Pilgrim   |
|    1 | Ruby on rail                  | David Flanagan |
|    1 | Programming Erlang            | Joe Armstrong  |
+------+-------------------------------+----------------+

mysql> select * from tag;
+---------+---------+
| tagname | book_id |
+---------+---------+
| ruby    |       1 |
| ruby    |       2 |
| web     |       2 |
| erlang  |       3 |
+---------+---------+

假如有如此需求,查找即是ruby又是web方面的书籍,如果以关系型数据库会怎么处理?
1 select b.name, b.author  from tag t1, tag t2, book b
2 where t1.tagname = 'web' and t2.tagname = 'ruby' and t1.book_id = t2.book_id andb.id = t1.book_id

tag表自关联2次再与book关联,这个sql还是比较复杂的,如果要求即ruby,但不是web方面的书籍呢?

关系型数据其实并不太适合这些集合操作。

REDIS的设计

首先book的数据肯定要存储的,和上面一样。

set book:1:name    ”The Ruby Programming Language”
Set book:2:name     ”Ruby on rail”
Set book:3:name     ”Programming Erlang”

set book:1:author    ”Mark Pilgrim”
Set book:2:author     ”David Flanagan”
Set book:3:author     ”Joe Armstrong”

tag表我们使用集合来存储数据,因为集合擅长求交集、并集

sadd tag:ruby 1
sadd tag:ruby 2
sadd tag:web 2
sadd tag:erlang 3

那么,即属于ruby又属于web的书?

inter_list = redis.sinter("tag.web", "tag:ruby")

即属于ruby,但不属于web的书?

inter_list = redis.sdiff("tag.ruby", "tag:web")

属于ruby和属于web的书的合集?

inter_list = redis.sunion("tag.ruby", "tag:web")

简单到不行阿。

从以上2个例子可以看出在某些场景里,关系型数据库是不太适合的,你可能能够设计出满足需求的系统,但总是感觉的怪怪的,有种生搬硬套的感觉。

尤其登录系统这个例子,频繁的为业务建立索引。放在一个复杂的系统里,ddl(创建索引)有可能改变执行计划。导致其它的sql采用不同的执行计 划,业务复杂的老系统,这个问题是很难预估的,sql千奇百怪。要求DBA对这个系统里所有的sql都了解,这点太难了。这个问题在oracle里尤其严 重,每个DBA估计都碰到过。对于MySQL这类系统,ddl又不方便(虽然现在有online ddl的方法)。碰到大表,DBA凌晨爬起来在业务低峰期操作,这事我没少干过。而这种需求放到redis里就很好处理,DBA仅仅对容量进行预估即可。

未来的OLTP系统应该是kv和关系型的紧密结合。

http://blog.csdn.net/iloveyin/article/details/7105181

 

分享到:
评论

相关推荐

    Redis缓存设计与性能优化精要

    最后,提供了Redis键值设计和性能优化的实用建议,如合理的key名设计、避免bigkey、选择合适的数据类型,以及客户端连接池使用优化。这些内容对于提升Redis应用性能、保障系统稳定性具有重要意义。

    Redis 数据库的键值设计

    文档描述了Redis 数据库的键值设计,个人感觉很好!

    阿里云Redis的规范:键值设计、命令使用、客户端使用、相关工具.docx

    阿里云Redis的规范:键值设计、命令使用、客户端使用、相关工具.docx

    redis:Redis键值数据库源码注释

    这份注释是我在创作新版《 Redis设计与实现》期间,为了了解Redis的内部实现而制作的,所有在书中有介绍的内容,在源码中都进行了相应的注释。 在注释的过程中,除了少量空间和空行方面的调整外,没有对原始代码进行...

    浅谈Redis数据库的键值设计

     下面举一些常见适合kv数据库的例子来谈谈键值的设计,并与关系型数据库做一个对比,发现关系型的不足之处。  用户登录系统  记录用户登录信息的一个系统, 我们简化业务后只留下一张表。  关系型数据库的...

    Redis中键值过期操作示例详解

    主要给大家介绍了关于Redis中键值过期操作的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Redis具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧

    redis设计与实现.pdf

    Redis 和其他很多 key-value 数据库的不同之处在于,Redis 不仅支持简单的字符串键值对,它 还提供了一系列数据结构类型值,比如列表、哈希、集合和有序集,并在这些数据结构类型上 定义了一套强大的 API 。 通过...

    Redis 数据库

    Redis数据库,Windows版本。正版可靠实用。。。。。。。

    redisson.rar

    Redisson在基于NIO的Netty框架上,充分的利用了Redis键值数据库提供的一系列优势,在Java实用工具包中常用接口的基础上,为使用者提供了一系列具有分布式特性的常用工具类。使得原本作为协调单机多线程并发程序的...

    redisson-demo.rar

    Redisson在基于NIO的Netty框架上,充分的利用了Redis键值数据库提供的一系列优势,在Java实用工具包中常用接口的基础上,为使用者提供了一系列具有分布式特性的常用工具类。使得原本作为协调单机多线程并发程序的...

    Redis设计与实现学习思维笔记.xmind

    Redis是用C语言开发的一个开源的高性能键值对(key-value)数据库,官方提供测试数据,50个并发执行100000个请求,读的速度是110000次/s,写的速度是81000次/s ,且Redis通过提供多种键值数据类型来适应不同场景下的...

    基于Spring Boot+WebSocket+Redis开发的分布式即时通讯群聊系统源码+项目使用说明.zip

    自动清除长期废弃的群聊(基于Redis键值过期功能)。 实时推送用户所加入的群组列表的最新动态(WebSocket连接实现)。 用户登录状态验证(Redis Token)。 一定时间内的消息撤回功能(HTTP接口实现)。

    云资源下载V1.2

    (15)浅谈redis数据库的键值设计 (16)为什么使用 Redis及其产品定位 http://www.aboutyun.com/thread-5601-1-1.html (1)MongoDB权威指南 (2)Facebook游戏开发商wooga的架构基于MySQL和Redis (3)Hive技术分享_J ...

    kohana-phpredis:FROZEN - Kohana 的 Redis

    是一个扩展,提供用于与 Redis 键值存储通信的 API。 它是用 C 编译的。 将 PHPRedis 结合到以数据库模块设计为模型的 Kohana 中。文档Kohana 的文档可以在找到,其中还包含一个 API 浏览器。 安装 PHPRedis 可以在...

    redis-py:Redis Python客户端

    Redis键值存储的Python接口。 Python 2兼容性说明 redis-py 3.5.x将是支持Python 2的最新版本的redis-py。在2020年8月1日之前,3.5.x版本将继续获得支持Python 2的错误修复和安全补丁。redis-py 4.0将是下一个主要...

    java研究生毕业设计汽车远程通讯系统项目源码.zip

    论文里表述的是Redis存储键值对 实际代码做一定的修改用配置文件appliction.propertities 涵盖全局变量 com.lyl.netty_mybatis_obd_01.redis.testClass 与之绑定 在com.lyl.netty_mybatis_obd_01.redis.RedisUtil中...

    java研究生毕业设计一个汽车远程通讯系统项目源码.zip

    论文里表述的是Redis存储键值对 实际代码做一定的修改用配置文件appliction.propertities 涵盖全局变量 com.lyl.netty_mybatis_obd_01.redis.testClass 与之绑定 在com.lyl.netty_mybatis_obd_01.redis.RedisUtil中...

    docker 部署Redis集群节点.pdf

    Redis是一款开源的高性能内存键值存储数据库,常用于缓存、数据库和消息中间件等场景。如果您需要部署一个Redis集群,Docker可以帮助您更轻松地完成此任务。以下是关于使用Docker部署Redis集群节点的一些资源: - ...

    阿里云Redis开发规范

    本⽂文介绍了了在使⽤用阿⾥里里云Redis的开发规范,从键值设计、命令使⽤用、客户端使⽤用、相关 ⼯工具等⽅方⾯面进⾏行行说明,通过本⽂文的介绍可以减少使⽤用Redis过程带来的问题。

    内存内键值存储方案ChronicleMap.zip

    Chronicle Map是一套内存内键值存储方案,其设计目标在于实现低延迟与/或多进程应用,例如贸易与金融市场应用。这套库主要面向中等读取与写入查询延迟场景,允许用户根据服务器中的硬件执行线程数量编写合适的查询...

Global site tag (gtag.js) - Google Analytics