分布式系统之缓存的微观应用经验谈(一) 【基础细节篇】

分布式系统之缓存的微观应用经验谈(一) 【基础细节篇】

前言

  近几个月一直在忙些琐事,几乎年后都没怎么闲过。忙忙碌碌中就进入了2018年的秋天了,不得不感叹时间总是如白驹过隙,也不知道收获了什么和失去了什么。最近稍微休息,买了两本与技术无关的书,其一是Yann Martel 写的《The High Mountains of Portugal》(葡萄牙的高山),发现阅读此书是需要一些耐心的,对人生暗喻很深,也有足够的留白,有兴趣的朋友可以细品下。好了,下面回归正题,尝试写写工作中缓存技术相关的一些实战经验和思考。

正文

  在分布式Web程序设计中,解决高并发以及内部解耦的关键技术离不开缓存和队列,而缓存角色类似计算机硬件中CPU的各级缓存。如今的业务规模稍大的互联网项目,即使在最初beta版的开发上,都会进行预留设计。但是在诸多应用场景里,也带来了某些高成本的技术问题,需要细致权衡。本系列主要围绕分布式系统中服务端缓存相关技术,也会结合朋友间的探讨提及自己的思考细节。文中若有不妥之处,恳请指正。

  第一篇这里尝试尽可能详细的谈谈缓存自身的基础设计应用,以及相关的操作细节等(具体应用主要以Redis 举例)。

  一、提下缓存的分类和基本特点(本文主要指服务端数据缓存)

    1.1 一种区分

      缓存基于不同的条件有很多种划分方式,本地缓存(Local cache)和分布式缓存(Distributed cache)是一种常见分类,两者自身又包含很多细类。

      本地并不是指程序所在本地服务器(从严格概念来说),而是更细粒度的指位于程序自身的内部存储空间,而分布式更多强调的是存储在进程之外的一个或者多个服务器上,彼此交互通信,在具体软件项目的设计和应用中,多数时候是混合一体。

      (当然,个人认为对缓存本质的理解才是最重要的,至于概念上的分类只是一个不同理解下的划分而已)

    1.2 一些技术成本

      在具体项目架构设计时,单纯使用前者(本地缓存)的开发成本毋庸置疑是极低的,主要考虑的是本机的内存负载或者极少量的磁盘I/O影响。而后者的设计初心是为了利于分布式程序之间缓存数据的高效共享和管理,除了考虑缓存所在服务器自身的内存负载,设计时更需要充分考虑网络I/O、CPU的负载,以及某些场景下的磁盘I/O的代价,同时还在具体设计时尽可能规避和权衡整体稳定性和效率,这些不仅仅只是作为缓存服务器的硬件成本和技术维护。 需要谨慎考虑的底层问题包括缓存间通信、网络负载和延迟等各种需要权衡的细节。

      其实如果理解了缓存本质就该知道,任何存储介质在适当的场景下都可以充当一个高效的缓存角色并进行项目集成和缓存间集群。常见主流的Memcached和Redis等均是属于后者范畴,甚至可以包括如基于NoSql设计的MongoDB这类文档数据库(但这是从角色角度讲,而狭义划分上这是基于磁盘的存储库,需要注意,各有专攻)。这些第三方缓存在进行项目集成和缓存间集群,也需要解决一些问题。甚至项目迭代到了后期阶段,往往还需要具备较高专业知识的运维同时参与,并且在开发中的逻辑设计和代码实现也会增加一定的工作量。所以有时候在具体项目的设计上,一方面要尽可能预留,一方面还得根据实际情况尽可能精简。

      额外说下其他体会:在个人有限的技术学习和实践里,关于节点数据交互,尤其是服务间通信,是不存在完美的闭环的,理论上也都是在“当前阶段”面向“高一致”的权衡罢了(大概跟生活是一样的吧,呵,写偏了)。

  二、关于缓存数据库结构的一些设计细节

  

    (由于目前个人工作中大多数情况应用的是Redis 3.x,以下若有特性关联,均是以此作为参照说明。)

    2.1 实例(Instance)

      根据业务场景,公共数据和业务耦合数据,一定分别使用不同的实例。如果是单实例,才可以考虑以DB划分。当你使用的是Redis,那么DB在Redis里是有数据隔离,但没有严格权限限制,所以划库只是一种选择。在Cluster集群里则是保持默认单个库,不过实际中我会尝试根据项目大小来调整,至于在哪个开发阶段则是作为预留设计。

      额外需要注意的是,作为重度依赖服务器内存的缓存产品,如果开启了持久化(后面会提到),并且在为并发量极大的服务提供支持时,服务器硬件资源会出现大量抢占,请结合持久策略配置,考虑实例是否进行分盘存储。持久化本质是将内存数据同步写入硬盘(刷盘),而磁盘I/O实在有限,被迫的写入阻塞除了造成线程阻塞和服务超时,还会导致额外异常甚至波及其他底层依赖服务。当然,我的建议是,如果条件允许,最好是在项目初期设计时就进行规划并确定。

    2.2 缓存“表”(Table)

      一般缓存中并没有传统RDBMS中直观的表概念(往往以键值对“KV”形式存在),但从结构上来讲,键值对本身就可以组装为各种表结构。一般我会先生成数据库表关系图,然后分析什么时候存储字符串,什么时候存储对象,然后使用缓存键(KEY)进行表和字段(列)分割。

      假定需要存储一个登录服务器表数据,包含字段(列):name、sign、addr,那么可以考虑将数据结构拆分为以下形式:
        { key : "server:name" , value : "xxxx" }
        { key : "server:sign" , value : "yyyy" }
        { key : "server:addr" , value : "zzzz" }

      需要注意的是,往往在分布式缓存产品中,例如Redis,存在多种数据结构(如String、Hash等),还需要根据数据关联性和列的数量,来选择对应缓存的存储数据结构,相关存储空间和时间复杂度是完全不同的,而这个在初期阶段是很难感受到的。

      同时,就算缓存的内存设置的足够大,剩余也很多,也同样需要考虑类似RDBMS中的单表容量问题,控制条目数量不能无限增长(比如预知到存储条目可以轻松达到百万级),“分库分表”的设计思路都是相通的。

    2.3 缓存键(Key)

      上面提到了基于缓存键来设计表,这里再单独说明一下键相关的个人规范。在键长度足够简短的前提下,如果关联相同业务模块,则必须设计为以同一个标识(代号)开头,目的是方便查找和统计管理。
如用户登录服务器列表:
        { key : "ul:server:a" , value : "xxxx" }
        { key : "ul:server:b" , value : "yyyy" }

      另外,每个独立业务系统可考虑配置一个唯一的通用前缀标识,当然,这里不是必需,若实际工作中,如果使用的是不同库,则可以忽略。

    2.4 缓存值(value)

      缓存中的值(这里指单一条目)的大小没有平均标准,但Size自然是越小越好(若使用的是Redis,一次操作的value较大会直接影响整个Redis的响应时间,不仅仅是指网络I/O)。如果存储占用空间直达10M+,建议考虑关联的业务场景是否可以拆分为热点和非热点数据。

    2.5 持久化(Permanence)

      上面也简单提了下,一般来说,持久和缓存本身是没有直接关系的,可以粗略想象为一个面向硬盘一个面向内存。但如今的Web项目里,有些业务场景是高度依赖缓存的,持久化可以一方面帮助提高缓存服务重启后的快速恢复,一方面提供特定场景下的存储特性。当然,由于持久化必然需要牺牲一些性能,包括CPU的抢占和硬盘I/O影响。不过大多数时候是利大于弊,建议在应用缓存的时候,没有特别情况的话,尽量搭配持久化,无论是使用自身机制还是第三方来实现。

      如果是使用的Redis,其自身就具备相关持久策略,包含AOF和RDB,我在大多数情况下是两者同时配置的(当然,最新官方版本本身也提供了混合模式)。如果在一些非高并发的场景下,或者说在一些中小项目的管理模块里,仅仅只是作为优化手段,确定了不需持久,也可以直接设置关闭,节约性能开销损耗,但建议在程序中将该实例做好标注,确保该实例的公共使用范围。

    2.6 淘汰(Eliminate)

      缓存如果无限制的增长,即使设置了较短的过期(Expiration ),在一些时间点上,高并发的一批大数据会在较短时间内就达到了可使用内存的峰顶,此时程序中与缓存服务器的交互会出现大量延迟和错误,甚至给服务器自身都带来了严重的不稳定性。所以在生产环境里尽量给缓存配置最大内存限制,以及适当的淘汰策略。

      如果使用的是Redis,自身淘汰策略选择比较灵活。个人的设计是,在数据呈现类似幂律分布情况下,总有大量数据访问较低,我会选择配置allkeys-lru、volatile-lru,将最少访问的数据进行淘汰。再比如缓存是作为日志应用的,那么我一般是项目前期是配置no-enviction,后期会配置为volatile-ttl。当然,我也见过一种特殊业务下的设计,缓存直接用来作为轻量的持久数据库使用,而且是终端,开始觉得有些新奇,后来发现是非常符合业务设计的(比如几乎没有任何复杂逻辑和强事务)。所以合情合理,确实不应该禁锢在传统设计里,毕竟架构总是基于业务去实时组合和改变的。

  三、缓存的基础CURD和其他相关(在这里我主要讨论一级缓存)

    3.1 新增(Create)

      如果没有特殊业务需求(如上面提到的),插入必须设置过期时间。同时,尽量保证过期随机性。如果是进行批量缓存,则个人的做法是保证设置的过期时间上至少是分散的,目的是为了降低缓存雪崩等风险和影响(关于这些我会在以后的扩展篇里尝试阐述)。

      如,批量缓存的对象是一个结果集,条目有10万条,缓存时间基础为 60*60*2(sec),现在需要同时进行缓存。我的做法是默认生成一个随机数,如random(范围 0 - 1000),过期时间则设置为( 60*60*2 + random ) 。

    3.2 修改(Update)

      更新一条缓存的数据,注意是否需要重新调整过期时间。同时在很多场合,如多个缓存间同步时,建议直接删除该缓存,而不是更新缓存。修改操作很多时候是关联到DB间的同步操作的,相对考究的多一些,需要权衡分布式事务上的问题,后续文章里会写到。

    3.3 读取(Read)

      查找缓存时,如果存在多条,并确定数据量不大,务必使用严格匹配key的模式,而尽量不要使用通配符方式。虽然发送指令的key数据变长了,但却避免了不必要的缓存内的搜索性能损耗。
      例如单纯相信Redis里自身的存储优化,无限制的使用 keys pattern而不考虑时间复杂度,同时造成大量线程阻塞(这里与主从复制无关)。如果折中使用scan分页替代,也并非一种“无忧”的实现,一是需要在程序代码的封装里设置较低的容量,二是请务必在程序逻辑里对数据幻读等潜在问题做相关的管控处理。

      另外可以额外类比一种场景,操作DB中的大表,命中的热点数据分布靠后。

    3.4 删除 / 清空(Delete / Clear)

      删除缓存,一般有直接移除和设置时间过期(并不是任何时候都是滑动增加过期)两种方式,没什么细节上的说明。(倒是听过一种特殊业务场合,批量请求同类数据,并且即时性没有很高要求,设置过期时间并将时间稍作分散。)

      清空缓存,我在项目里目前并未应用,甚至也不提倡直接使用。但是假如在应用时,需要慎重考虑两个地方。一是清理时机,二是清理时效(若在Redis里,无论是flushdb或者flushall,都会形成一定阻塞)

    3.5 锁/信号(Locking)

      本身无关缓存,属于一些并发特性实现,有一定的适用场景。这在Redis中有一些基于原子的实现,但与本系列讨论无关。本人去年写过一篇与之相关的分享,详见:商城系统下单库存管控系列杂记(二)https://www.cnblogs.com/bsfz/p/7824428.html),但这里不赘述。

    3.6 发布-订阅(Publish-Subscribe)

      为什么提到这个跟生产消费(Produce-Consume)相关的动作呢?这个机制本身是不属于缓存自身的范畴的,而是更相关于消息队列(Message Queue)。之所以提到,是因为如今主流的缓存产品都自带这一特性,很多场景使用起来较方便,配置也简单,效率也够快。只是,往往会造成滥用。最关键是不必要的强耦合也降低了整体灵活性和性能,扩展性也实在有限。当然,这是我目前的看法。

      个人建议是这样的:如果没有特殊的场景应用,尽量不使用。至少本人是不会优先推荐使用缓存自身的发布订阅的,甚至在缓存集群系统中,需要考究的细节更多。而推荐的方式是,使用其他专业中间件解决,如基于MQ的产品替代方案。具体的候选有优秀的开源作品如RabbitMQ、Kafka等,包括有朋友提到的近两年国内阿里研发的RocketMQ等等,但是个人目前使用较多的依然是RabbitMQ。当然,这里不去过多赘述了,根据场景选择,合适的场景选用最合适的技术方案即可吧。

结语

  本篇先写到这里,下一篇会围绕相关主题尝试扩展阐述。

  PS,由于个人能力和经验均有限,自己也在持续学习和实践,文中若有不妥之处,恳请指正。

【预留占位:分布式系统之缓存的微观应用经验谈(二)【交互场景篇】】

End.

原文地址:https://www.cnblogs.com/bsfz/p/9568591.html

时间: 2024-10-10 01:31:35

分布式系统之缓存的微观应用经验谈(一) 【基础细节篇】的相关文章

分布式系统之缓存的微观应用经验谈(二) 【主从和主备高可用篇】

分布式系统之缓存的微观应用经验谈(二) [主从和主备高可用篇] 前言 近几个月一直在忙些琐事,几乎年后都没怎么闲过.忙忙碌碌中就进入了2018年的秋天了,不得不感叹时间总是如白驹过隙,也不知道收获了什么和失去了什么.最近稍微休息,买了两本与技术无关的书,其一是 Yann Martel 写的<The High Mountains of Portugal>(葡萄牙的高山),发现阅读此书是需要一些耐心的,对人生暗喻很深,也有足够的留白,有兴趣的朋友可以细品下.好了,下面回归正题,尝试写写工作中缓存技

[原创]分布式系统之缓存的微观应用经验谈(四) 【交互场景篇】

分布式系统之缓存的微观应用经验谈(四) [交互场景篇] 前言 近几个月一直在忙些琐事,几乎年后都没怎么闲过.忙忙碌碌中就进入了2018年的秋天了,不得不感叹时间总是如白驹过隙,也不知道收获了什么和失去了什么.最近稍微休息,买了两本与技术无关的书,其一是 Yann Martel 写的<The High Mountains of Portugal>(葡萄牙的高山),发现阅读此书是需要一些耐心的,对人生暗喻很深,也有足够的留白,有兴趣的朋友可以细品下.好了,下面回归正题,尝试写写工作中缓存技术相关的

缓存服务器设计与实现(番外篇)

这个系列又更新了. 今天谈一个问题,目前cache软件在业界的使用现状.cache系统其实最大的使用场景,还是主要集中在CDN厂商里. 大概在2010年之前,各大CDN厂商基本清一色的使用squid.那时候的squid是绝对的主力. squid的作为cache领域的鼻祖,正是由于历史的久远,很多近10年左右流行起来的很多系统特性,它本身并不支持.比如sendfile,splice和多核等方面的支持,由于这些特性属于核心架构方面的功能,后期如果想引进的话,需要对squid的核心做大量的修改.对于C

通过“分布式系统的8大谬误”反思APP的设计 第二篇 谬误2:网络没有时延

就在今天上午,我的系统的网络请求时延高达544毫秒到6937毫秒之间.而且这是在一个已激活的网络接口上.如果接口从省电模式开始激活的话,这还额外需要10秒钟的时间.因此为了提供良好的用户体验,App需要考虑至少十几秒的网络时延. 假如在app发起用户认证请求后,只有请求成功用户才能进入登录页面,这时已经过去7秒.如果接着App需要再发一条请求获取用户信息,那么用户被阻碍在登录页面总共多达14秒.所以我会尽可能打破这种必须前后按序发生的请求. 实际操作中,我会同时发送多个请求:尤其是有些请求,不占

分布式缓存之Ehcache与terracotta - Terracotta服务器概念篇

1.介绍 Terracotta服务器为Terracotta产品提供分布式数据平台.Terracotta服务器集群被称为Terracotta服务器阵列(TSA).Terracotta服务器阵列可以从单个服务器,到一个用于高可用性(HA)的基本的双服务器串联,再到一个提供可配置的规模.高性能和深度故障转移覆盖的多服务器阵列. Terracotta服务器的主要特性包括: 分布式内存数据管理:在内存中管理比数据网格多10-100x的数据 不复杂的可伸缩性:简单的配置和部署选项,用于扩展以满足日益增长的需

分布式系统JVM本地缓存同步实现dlcache

现成的分布式K/V缓存已经有很多的实现,最主要的比如redis,memcached.那为什么我们还要自己去实现呢,在我们解决了分布式系统下大量rpc调用导致的高延时后,我们发现很多服务需要大量的访问分布式缓存,由于分布式缓存通常部署在单独的服务器中,在lan中,通常单次网络也需要1ms,一个请求少的可能需要一两次缓存访问,复杂的服务比如委托.出入金.融资等会访问一二十次,即使程序已经优化,但仅访问分布式缓存花费的网络延时占据了整个响应时间的很大一部分比例,而这些需要广泛被访问的数据通常数据量本身

解析Java分布式系统中的缓存架构(上)

作者 陈彩华 文章转载交流请联系 [email protected] 本文主要介绍大型分布式系统中缓存的相关理论,常见的缓存组件以及应用场景. 1 缓存概述 2 缓存的分类 缓存主要分为以下四类 2.1 CDN缓存 基本介绍 CDN(Content Delivery Network 内容分发网络)的基本原理是广泛采用各种缓存服务器,将这些缓存服务器分布到用户访问相对集中的地区或网络中,在用户访问网站时,利用全局负载技术将用户的访问指向距离最近的工作正常的缓存服务器上,由缓存服务器直接响应用户请求

深入理解分布式系统中的缓存架构(上)

本文主要介绍大型分布式系统中缓存的相关理论,常见的缓存组件以及应用场景. 1 缓存概述!2 缓存的分类 缓存主要分为以下四类!2.1 CDN缓存 基本介绍 CDN(Content Delivery Network 内容分发网络)的基本原理是广泛采用各种缓存服务器,将这些缓存服务器分布到用户访问相对集中的地区或网络中,在用户访问网站时,利用全局负载技术将用户的访问指向距离最近的工作正常的缓存服务器上,由缓存服务器直接响应用户请求 应用场景 主要缓存静态资源,例如图片,视频 应用图优点 2.2 反向

深入理解分布式系统中的缓存架构(下)

承接上一篇<理解分布式系统中的缓存架构(上)>,介绍了大型分布式系统中缓存的相关理论,常见的缓存组件以及应用场景,本文主要介绍缓存架构设计常见问题以及解决方案,业界案例. 1 分层缓存架构设计2 缓存带来的复杂度问题 常见的问题主要包括 数据一致性 缓存穿透 缓存雪崩 缓存高可用 缓存热点 下面逐一介绍分析这些问题以及相应的解决方案. 数据一致性 因为缓存属于持久化数据的一个副本,因此不可避免的会出现数据不一致问题.导致脏读或读不到数据的情况.数据不一致,一般是因为网络不稳定或节点故障导致 问