全栈必备 缓存cache

Cache: a collection of data duplicating original values stored elsewhere on a computer, usually for easier access—— 维基百科

缓存是系统快速响应中的一种关键技术,是一组被保存起来以备将来使用的东西,介于应用开发和系统开发之间,是产品经理们经常顾及不到的地方,算是技术架构中的非功能性约束吧。

也就是说,缓存是系统调优时常用且行之有效的手段,无论从操作系统还是应用系统,缓存策略无处不在。

很多技术都打着缓存的旗号,所以谈起缓存往往似是而非,与语境有着紧密的关系,换个说法,来看一看缓存在不同场景的分类。

客户端缓存

浏览器的缓存可以将之前渲染的页面保存为文件,当用户再次访问时可用避开网络连接,从而减少负载。现在的HTML5支持了本地存储,大部分BS 应用都可以举重若轻了。

如何把客户端缓存对于业务组件透明和客户端缓存数据及时更新,是客户端缓存能否成功应用的关键。

客户端可以将内容缓存在内存,文件,或本地数据库(例如Sqlite)中。

例如,iOS 的图片缓存框架SDWeb架构如下:

web代理

web 代理的作用跟浏览器的内置缓存类似,只是位于浏览器和互联网之间,网络请求通过代理来中继。对于企业而言,即可以节省成本,又能提高性能。

对于Web代理而言,曾经流行的是Squid,它支持建立复杂缓存层级结构的能力,详细的日志、高性能缓存以及用户认证支持。Squid同时支持各种插件,例如Squid Guard就是一个提供URL过滤的插件,对于屏蔽某些站点和内容十分有用。如果想分析Squid的各种指标,webalizer 应该是个不错的选择。

Squid 的内部机制如下:

边缘缓存

边缘缓存位于应用服务器的前面,可以处理来自不同用户的请求,主要用于向用户提供静态的内容,以减少应用服务器的介入。边缘缓存的商业化服务就是CDN了,例如AWS 的Cloud Front,我国的ChinaCache等。

边缘缓存的一个有名的开源工具就是varnish,在默认情况下进行保守缓存。也就是说,varnish 只缓存它所知的安全内容。varnish的一个特性是使用虚拟内存,精妙之处在于利用了操作系统的管理机制。varnish可以高度定制如何处理请求,缓存哪些内容。

Varnish 的内部机制如下:

详情参见www.varnish-cache.org。

平台缓存

平台缓存是用来写应用的框架,或者缓存的专用库(如PHP中的Smarty模版库)。

Java 语言中,缓存框架更多,例如EHcache,Cacheonix,Voldemort,JBoss Cache等等。

看一下EHcache的系统结构结构:

Ehcache是一个Java实现的开源分布式缓存框架,可以让数据保存在不同服务器的内存中,在需要数据的时候可以快速存取。通过声明配置、在xml中配置、在程序里配置或者调用构造方法时传入不同的参数。

Voldemort是一款基于Java开发的分布式键-值缓存系统,像JBoss Cache一样,Voldemort同样支持多台服务器之间的缓存同步,以增强系统的可靠性和读取性能。

简单来说,就平台级缓存而言,只需要在框架侧配置一下属性即可,而不需要调用特定的方法或函数。

应用缓存

应用级缓存,需要自己通过代码来实现缓存。这里是NoSQL的胜场,不论是Redis 还是MongoDB,都可以作为应用缓存的工具。一个典型的方式是,每分钟或一段时间后统一生成某类页面存储在缓存中,也可以在热数据变化时更新缓存。

Redis 在应用级缓存中的作用举足轻重,新浪微博有着几乎世界上最大的redis 集群。 Redis支持主从同步。数据可以从主服务器向任意数量的从服务器上同步,从服务器可以是关联其他从服务器的主服务器。这使得Redis可执行单层树复制。存盘可以有意无意的对数据进行写操作。由于完全实现了发布/订阅机制,使得从数据库在任何地方同步树时,可订阅一个频道并接收主服务器完整的消息发布记录。同步对读取操作的可扩展性和数据冗余很有帮助。

Redis 的客户端编程语言众多,可以满足绝大多数的应用。

数据库缓存

数据库缓存是一类特殊的缓存。大多数数据库不需要配置就可以快速运行,但并没有为特定的需求进行优化。在数据库调优的时候,缓存优化是一项很重要的工作。

以MySQL为例,MySQL中使用了查询缓冲机制,将SELECT语句和查询结果存放在缓冲区中,以后对于同样的SELECT语句,将直接从缓冲区中读取结果,以节省查询时间,提高了SQL查询的效率。

通过调节以下几个参数可以知道query_cache_size设置得是否合理:

  • Qcache inserts
  • Qcache hits
  • Qcache lowmem prunes
  • Qcache free blocks
  • Qcache total blocks

当然,深入数据库还有很多值得学习的地方。

缓存的协议支持

对web应用而言,http1.0 提供了一些很基本的缓存特性,例如在服务器侧设置Expires 的http头来告诉客户端在重新请求文件之前缓存多久是安全的,可以通过if-modified-since 的条件请求来使用缓存。其中,发送的时间是文件最初被下载的时间,而不是即将过期的时间,如果文件没有改变,服务器可以用304-Not Modified 来应答。客户端收到304代码,就可以使用缓存的文件版本了。客户端可以设置Pragma:no-cache从服务器之间获取内容。

Http 1.1有了较大的增强,缓存系统被形式化了,引入了实体标签e-tags,是文件或对象的唯一标识。这意味着可以请求一个资源、提供所持有的文件,然后询问服务器这个文件是否有变化。如果某一个文件的e-tag 是有效的,服务器会生成304-Not Modified 应答,并提供正确文件的e-tag,否则,发送200-OK应答。以浏览器为例的示意图如下:

关于HTTP2.0中有关缓存的技术,还有待研究。

总而言之,缓存——cache,是一种挺复杂的技术,除了应用场景之外,更进一步,还要理解命中,Cache Miss,存储成本,索引成本,失效,替代策略的诸多概念,从而了解缓存算法,真正的掌握缓存技术。

时间: 2024-10-12 21:07:54

全栈必备 缓存cache的相关文章

再谈<全栈必备的技术栈设想>一文

在SDCC2016的架构师进阶之路主题,我分享了<老曹眼中的全栈架构师>话题,会后在csdn博客发布了<全栈必备的技术栈设想>一文,在我的公众号(wireless_com)发的是<全栈的技术栈设想>.然后,有幸得到了中生代技术(freshmanTechnology)和多人的转载,中生代技术还专门开通了全栈架构师深度讨论群,引起了很多的争论和争议. 主要分为以下三种观点: 1)根本没有意义,纯属忽悠 如网友回复:"鬼都知道说的什么 数据 缓存 业务 性能 消息队

全栈必备的技术栈设想

喔家ArchiSelf 参加今年的SDCC确实挺高兴的,向大师Joe Armstrong 当面求教,与周爱民老师同台,在我们的架构师进阶之路专场有4个七零后的老码农,瞬间没有了孤独感,甚至有一点窃窃之喜. 实在没想到会有这么多朋友关注这个专题,会场有了些拥挤,呼吸也不那么舒服了.答应朋友们的事,今天就做到,下面是昨天的PPT内容和简要说明,详细内容还请关注CSDN 和SDCC的相关发布. 惯例是开始介绍自己,老码农,都没什么可吹嘘的地方. 看一下工程师和架构师的区别,简单地,工程师关注的是功能和

全栈必备 JavaScript基础

JavaScript 来了 喔家ArchiSelf 1995年,诞生了JavaScript语言,那一年,我刚刚从大学毕业.在今年RedMonk 推出的2017 年第一季度编程语言排行榜中,JavaScript 排第一,Java 第二,Python 反超 PHP 排第三,PHP 第四,C# 和 C++ 并列第五.RedMonk 排名的主要依旧是各种编程语言在 Stack Overflow 和 GitHub 上的表现,比如编程语言在 Stack Overflow 上的讨论数量,在 GitHub 上的

全栈必备——MySQL性能调优

对于全栈而言,数据库技能不可或缺,关系型数据库或者nosql,内存型数据库或者偏磁盘存储的数据库,对象存储的数据库或者图数据库--林林总总,但是第一必备技能还应该是MySQL.从LAMP的兴起,到Mariadb的出现,甚至PG的到来,熟练的MySQL技能都是大有用武之地的. MySQL数据库技术的方方面面也是很多,这里只涉及必备的性能调优,推崇从下向上的性能调优,主要包括运行环境,配置参数,SQL性能,和系统架构设计调优. 运行环境调优 这里是Linux的天下,MySQL 运行环境的调优往往和L

全栈必备Linux 基础

Linux 几乎无处不在,不论是服务器构建,还是客户端开发,操作系统的基础技能对全栈来说都是必备的. 系统的选择 Linux发行版本可以大体分为两类,一类是商业公司维护的发行版本,一类是社区组织维护的发行版本,前者以著名的Redhat(RHEL)为代表,后者以Debian为代表. Redhat,应该称为Redhat系列,包括RHEL.Fedora.CentOS(RHEL的社区克隆版本,免费).Ubuntu严格来说不能算一个独立的发行版本,Ubuntu是基于Debian加强而来,一个拥有Debia

全栈必备 Linux 基础

Linux 几乎无处不在,不论是服务器构建,还是客户端开发,操作系统的基础技能对全栈来说都是必备的. 系统的选择 Linux发行版本可以大体分为两类,一类是商业公司维护的发行版本,一类是社区组织维护的发行版本,前者以著名的Redhat(RHEL)为代表,后者以Debian为代表. Redhat,应该称为Redhat系列,包括RHEL.Fedora.CentOS(RHEL的社区克隆版本,免费).Ubuntu严格来说不能算一个独立的发行版本,Ubuntu是基于Debian加强而来,一个拥有Debia

全栈必备 负载均衡

一个了不起的创意会产生一个很棒的产品,如果它一炮走红,你发现手中的是下一个facebook 或者twitter,而且随着用户越来越多,会变得越来越慢,该怎么办呢?对全栈而言,解决这类问题的一个重要技能就是--负载均衡. 什么是负载均衡 负载(load)一词起源于典型系统,指连接在电路中消耗电能的装置,负载(用电器)的功能是把电能转变为其他形式能.引申出来,一个是实体,一个转化. 于是,对于实体,有了通信帧或者报文中数据字段的内容被称为信息负载(payload),网络负载指的就是网络中继承载的流量

全栈必备——Git

为什么使用Git Git 是 Linus Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件.大神就是大神,在开发了Linux之后,Git 是又一抗鼎之作.这是唯一的理由么? Git在软件开发中位置--配置管理SCM Software configuration management (SCM, or just plain CM) is an organizational framework - that is, a discipline - for mana

全栈必备 网络编程基础

我们是幸运的,因为我们拥有网络.网络是一个神奇的东西,它改变了你和我的生活方式,改变了整个世界. 然而,网络的无标度和小世界特性使得它又是复杂的,无所不在,无所不能,以致于我们无法区分甚至无法描述. 对于一个码农而言,了解网络的基础知识可能还是从了解定义开始,认识OSI的七层协议模型,深入Socket内部,进而熟练地进行网络编程. 关于网络 关于网络,在词典中的定义是这样的: 在电的系统中,由若干元件组成的用来使电信号按一定要求传输的电路或这种电路的部分,叫网络. 作为一名从事过TMN开发的通信