浏览器 HTTP 缓存原理分析

转自:http://www.cnblogs.com/tzyy/p/4908165.html

浏览器缓存原理:

  1、浏览器第一次访问服务器资源/index.html,在浏览器中没有缓存文件,直接向服务器发送请求,服务器返回200 OK 实体中返回index.html文件内容,并设置一个缓存过期时间,一个文件修改时间,一个根据index.html内容计算出来的实体标记Entity Tag简称ETag,浏览器将/index.html路径的请求缓存到本地

2、浏览器第二次访问服务资源/index.html ,由于本地已经有了此路径下的缓存文件,所以这次就不直接向服务器发送请求了

  1)首先进行缓存过期判断,浏览器根据@1中设置的缓存过期时间,判断缓存文件是否过期

  情景1:没有过期:则不向服务器发送请求,直接使用缓存中的文件,这时我们在浏览器的控制台中可以看到200K,此时的情况就是完全使用缓存,浏览器与服务器没有任何交互

  情景2:若已过期,则向服务器发送请求,此请求中会带上@1设置文件修改时间和ETag

    然后进行资源更新判断,服务器根据浏览器传送过来的文件修改时间,判断自浏览器上次请求之后,文件有没有发生变化;根据ETag,判断文件内容自上次请求之后,有没有发生变化,

    情景一:若两种判断的结论都是文件没有修改过,则服务器不会给浏览器发送Index.html的内容了,而是直接告诉它,内容没有被修改,你用你那边的缓存吧~304 Not Modified 此时浏览器就会从本地获取index.html的内容了,此时的情况较协议缓存,这是浏览器跟服务器是有一次交互的

    情景二:若修改时间跟文件内容有一个改变,则服务器会受理此次请求,之后的操作同@1一样

 

一图以蔽之

缓存相关首部字段 {缓存设置是前端设置,还是后端?}

request缓存相关首部字段

① cache-control 用来做缓存过期判断

常用指令:

  • no-cache 不直接使用缓存,始终向服务器发起请求
  • max-age 缓存过期时间,是一个时间数值,比如3600秒,设置为0的时候效果等同于no-cache
  • s-maxage 给缓存代理用的指令,对直接返回资源的server无效,当s-maxage生效时,会忽略max-age的值
  • only-if-cached 若有缓存,则只使用缓存,若缓存文件出问题了,请求也会出问题

② Pragma 用来做缓存过期判断

它可以取值no-cache

这是一个http1.0遗留的字段,当它和cache-control同时存在的时候,会被cache-control覆盖

③ if-match / if-none-match 用来做资源更新判断

这个指令会把缓存中的Etag传给服务器,服务器用它来和服务器端的资源Etag进行对比,若不一致则证明资源被修改了,需要响应请求为 200 OK

④ if-modified-since 用来做资源更新判断

这个指令会把文件的上一次缓存中的文件的更新时间传给服务器,服务器判断文件在这个时间点后是否被修改,如果被修改过则需要响应请求为200 OK

response缓存相关首部字段

① cache-control 用来设置缓存过期时间

常用指令:

  • no-cache 让客户端不直接使用缓存,始终向服务器发起请求,不设置默认是这个,上边截图中的请求就是省略了,所以客户端不会直接使用缓存。
  • max-age 缓存过期时间,是一个时间数值,比如3600秒,设置为0的时候效果等同于no-cache
  • s-maxage 给缓存代理用的指令,对直接返回资源的server无效,当s-maxage生效时,会忽略max-age的值
  • private/public 默认是private,只在一个浏览器中缓存,设置为public时缓存可被多个用户共享

② Etag 用来设置根据资源内容生成的实体标签

这个值有强tag和弱tag,区别是计算方式不同,只有强tag才会在资源被更新的时候立即发生变化,请求首部中的if-match/if-none-match字段就会传回这个值给服务端

③ age

这个字段用来告诉客户端,这个response是在多久前被创建的,单位为秒,缓存服务器返回资源的时候必须创建此字段

实体首部缓存相关字段

response的head里边可能还包括实体首部,实体首部是紧跟在response首部后边的。

①last-modified-time ——用来设置资源最后修改时间

②Exprire —— 设置文件过期时间

这个字段的作用和cache-control相同,不同的是它直接指定一个缓存过期时间点,容易受客户端时间的影响。

这也是一个遗留的字段,和cache-control同时存在的时候会被后者覆盖

缓存配置的一些注意事项

① 只有get请求会被缓存,post请求不会

② Etag 在资源分布在多台机器上时,对于同一个资源,不同服务器生成的Etag可能不相同,此时就会导致304协议缓存失效,客户端还是直接从server取资源。可以自己修改服务器端etag的生成方式,根据资源内容生成同样的etag。

③ 系统上线,更新资源时,可以在资源uri后边附上资源修改时间、svn版本号、文件md5 等信息,这样可以避免用户下载到缓存的旧的文件

④ 观察chrome的表现发现,通过链接或者地址栏访问,会先判断缓存是否过期,再判断缓资源是否更新;F5刷新,会跳过缓存过期判断,直接请求服务器,判断资源是否更新。

目前只能回忆起这些了,以后遇到了再补充吧~

时间: 2024-10-17 14:41:21

浏览器 HTTP 缓存原理分析的相关文章

浏览器HTTP缓存原理分析

http://www.cnblogs.com/tzyy/p/4908165.html 章节目录 浏览器缓存原理 文字版描述 一图以蔽之 缓存相关首部字段 request缓存相关首部字段 response缓存相关首部字段 实体首部缓存相关字段 缓存配置的一些注意事项 以前项目中遇到了很多浏览器缓存相关的问题,也在网上查过资料,搞过服务器的配置,来确保客户端加载服务器资源的速度和资源有效性.最近仔细看了下http协议中和缓存相关的一些属性,总结一下. 浏览器缓存原理 文字版描述 ①浏览器第一次访问服

9大浏览器端缓存机制分析

浏览器缓存(Browser Caching)是浏览器端保存数据用于快速读取或避免重复资源请求的优化机制,有效的缓存使用可以避免重复的网络请求和浏览器快速地读取本地数据,整体上加速网页展示给用户.浏览器端缓存的机制种类较多,总体归纳为九种,这里详细分析下这九种缓存机制的原理和使用场景.打开浏览器的调试模式->resources左侧就有浏览器的8种缓存机制. 一.http缓存 http缓存是基于HTTP协议的浏览器文件级缓存机制.即针对文件的重复请求情况下,浏览器可以根据协议头判断从服务器端请求文件

MyBatis从入门到放弃七:二级缓存原理分析

前言 说起mybatis的一级缓存和二级缓存我特意问了几个身边的朋友他们平时会不会用,结果没有一个人平时业务场景中用. 好吧,那我暂且用来学习源码吧.一级缓存我个人认为也确实有些鸡肋,mybatis默认开启一级缓存,支持在同一个会话(sqlsession)同一个statement执行两次,则第二次会默认会使用第一次创建的缓存对象. 二级缓存前一篇粗略介绍了下,默认使用内存对象[PerpetualCache]内部维护一个HashMap对象来存储.那么先来看几张图片[图片来自一位朋友,文章最后参考连

深入了解浏览器缓存原理

浏览器缓存将文件保存在客户端,好的缓存策略可以减少对网络带宽的占用,可以提高访问速度,提高用户的体验,还可以减轻服务器的负担.因此我们有必要了解它的实现原理,用来提高网站的性能. 当一个客户端请求web服务器, 请求的内容可以从以下几个地方获取:服务器.浏览器缓存中或缓存服务器中.这取决于服务器端输出的页面信息.页面文件有三种缓存状态. 1.最新的:选择不缓存页面,每次请求时都从服务器获取最新的内容. 2.未过期的:在给定的时间内缓存,如果用户刷新或页面过期则去服务器请求,否则将读取本地的缓存,

浏览器html缓存

浏览器缓存将文件保存在客户端,好的缓存策略可以减少对网络带宽的占用,可以提高访问速度,提高用户的体验,还可以减轻服务器的负担.因此我们有必要了解它的实现原理,用来提高网站的性能. 当一个客户端请求web服务器, 请求的内容可以从以下几个地方获取:服务器.浏览器缓存中或缓存服务器中.这取决于服务器端输出的页面信息.页面文件有三种缓存状态. 1.最新的:选择不缓存页面,每次请求时都从服务器获取最新的内容. 2.未过期的:在给定的时间内缓存,如果用户刷新或页面过期则去服务器请求,否则将读取本地的缓存,

【转】MaBatis学习---源码分析MyBatis缓存原理

[原文]https://www.toutiao.com/i6594029178964673027/ 源码分析MyBatis缓存原理 1.简介 在 Web 应用中,缓存是必不可少的组件.通常我们都会用 Redis 或 memcached 等缓存中间件,拦截大量奔向数据库的请求,减轻数据库压力.作为一个重要的组件,MyBatis 自然也在内部提供了相应的支持.通过在框架层面增加缓存功能,可减轻数据库的压力,同时又可以提升查询速度,可谓一举两得.MyBatis 缓存结构由一级缓存和二级缓存构成,这两级

6. Nginx浏览器缓存原理

与缓存有关的请求头 key value 说明 Cache-Control max-age=0 客户端向服务器端表明,如果缓存过期了,但是过期时间还没有超过指定时间(以秒为单位),则直接返回304即可. If-Modified-Since Wed, 09 Aug 2017 10:28:55 GMT 根据修改时间来判断文件是否修改过.如果没有修改,则使用缓存. If-None-Match 598ae3e7-c 根据hash来判断文件是否修改过,如果没有修改,则使用缓存. 与缓存有关的响应头 key

[转载]浏览器的工作原理:新式网络浏览器幕后揭秘

原文地址 序言 这是一篇全面介绍 WebKit 和 Gecko 内部操作的入门文章,是以色列开发人员塔利·加希尔大量研究的成果.在过去的几年中,她查阅了所有公开发布的关于浏览器内部机制的数据(请参见资源),并花了很多时间来研读网络浏览器的源代码.她写道: 在 IE 占据 90% 市场份额的年代,我们除了把浏览器当成一个"黑箱",什么也做不了.但是现在,开放源代码的浏览器拥有了过半的市场份额,因此,是时候来揭开神秘的面纱,一探网络浏览器的内幕了.呃,里面只有数以百万行计的 C++ 代码.

深入理解HTTP协议、HTTP协议原理分析

深入理解HTTP协议.HTTP协议原理分析 目录(?)[+] http协议学习系列 1. 基础概念篇 1.1 介绍 HTTP是Hyper Text Transfer Protocol(超文本传输协议)的缩写.它的发展是万维网协会(World Wide Web Consortium)和Internet工作小组IETF(Internet Engineering Task Force)合作的结果,(他们)最终发布了一系列的RFC,RFC 1945定义了HTTP/1.0版本.其中最著名的就是RFC 26