HTTP协议探究（一）

一复习与目标

1 复习

序章主要用WrieShark抓包HTTP报文
复习了TCP协议
讲述了TCP协议与HTTP之间的关系
HTTP1.1更新原因：HTTP1.0一次TCP连接只能发送一次HTTP报文等
HTTP2.0更新原因：HTTP的报头太大、多路复用问题等（HTTP2.0未来研究）

2 目标

由于大家都有一定的基础（包括我），所以并不会照着书本一节一节地进行，所以这一节重点讲一下缓存相关的问题。
缓存的好处
缓存相关的状态码
缓存相关的首部
缓存的处理步骤

二为什么要有缓存？

减少冗余的数据传输
缓解网络瓶颈
降低对源服务器的要求
降低距离时延

注：其实所有的好处都是不去重复获取相同文件带来的。

三缓存存放在哪里？

代理服务器（如：Nginx）
浏览器（如：Chrome）

注：由于现在一般前后端分离开发，如：前端用Angular（Nginx），后端用Java（Tomcat），前端打包构建（代码压缩编译优化代码混淆等操作）成静态文件存放在Nginx中。本文主要以Chrome与Nginx的交互做例子。

四缓存相关状态码

200：请求成功
304：请求资源服务器，返回资源未改动
200：过期时间内，浏览器直接获取硬盘内的缓存数据（from disk cache）
304：过期时间内，浏览器直接获取内存内的缓存数据（from memory cache）

五缓存相关的HTTP首部

1 验证相关

（1）Etag示例

# 以Nginx生成的Etag值为例
# etag == last-modified的秒级Unix时间戳(16进制) - content-length(16进制)

# 响应首部
last-modified: Fri, 23 Nov 2018 03:47:36 GMT
content-length: 1408
etag: W/"5bf77858-580"

# 请求首部
if-none-match: W/"5bf77858-580"
if-modified-since: Fri, 23 Nov 2018 03:47:36 GMT

Nginx收到请求后，比较Etag值是否修改，修改则返回新文件，状态码为200。
否则，返回状态吗304，告知浏览器从硬盘获取即可。

（2）强弱验证器

弱验证器：服务器对文档进行一些非实质性或不重要的修改时，不希望已缓存的副本都失效。Etag表达："5bf77858-580"。
强验证器：文档进行任何修改都会使得缓存的副本失效。Etag表达：W/"5bf77858-580"。

2 Cache-Control

（1）响应请求角度

缓存请求指令

指令	参数	说明
no-cache	无	强制向源服务器再次验证（返回200或者304）
no-store	无	不缓存请求或者响应的任何内容（返回200）
max-age=[s]	必须	响应的最大Age值
max-stale(=[s])	可省略	过期也照常接收
min-fresh=[s]	必须	要求缓存服务器返回至少还未过指定时间的缓存资源
no-transform	无	代理不可更改媒体类型
only-if-cached	无	要求缓存服务器不重新加载响应，也不会再次确认资源有效性

缓存响应指令

指令	参数	说明
public	无	向任意方(代理或浏览器)提供响应的缓存
private	可省略	仅向特定用户(浏览器)返回响应
no-cache	无	强制向源服务器再次验证（返回200或者304）
no-store	无	不缓存请求或者响应的任何内容（返回200）
no-transform	无	代理不可更改媒体类型
must-revalidate	无	代理可缓存但是必须再向源服务器进行确认(忽略请求的max-stale)
proxy-revalidate	无	所有缓存服务器在接收到客户端带有该指令的请求返回响应之前，必须再次验证缓存的有效性
max-age=[s]	可省略	响应的最大Age值(忽略请求的Expires)
s-maxage = [ 秒]	必需	公共缓存服务器响应的最大Age值

（2）功能角度

什么是可以缓存的？响应(源服务器)决定
- public(共享缓存)：响应消息可被任何缓存保存
- private(私有缓存)：响应消息部分或者全部可被某个用户(如:浏览器)保存，但不可被共享缓存保存。
- no-cache(不缓存)：指定一个或多个field-name不可缓存，即每次都需要去验证
什么能被缓存保存？响应决定
- no-store(不保存)：防止敏感信息泄露，整个响应消息都不能保存。
对基本过期机制改进？响应或者请求决定
- Expires：指定过期时间。
- s-maxage(针对代理服务器)：对共享(缓存来说，s-maxage指定的值将会覆盖max-age缓存控制指令或Expires头域
- max-age(针对用户终端)：优先级高于Expires，max-age未到时，不会去源服务器请求，而是从本地硬盘或内存中获取。
- min-fresh(保鲜时间)：客户端想要响应至少在保鲜时间(min-fresh)内。
- max-stale(过期时间)：客户端想要响应在保鲜时间内或过期不超过max-stale；若max-stale没有赋值，则客户端愿接受任意年龄的陈旧响应。
缓存重验证和加载控制？用户代理(响应或者请求)决定
- max-age=0：强迫重验证它所拥有的缓存项。
- only-if-cache：糟糕的网络连接下，客户端希望缓存只返回缓存当前保存的响应，并且不需要通过源服务器对其缓存项进行重新加载或重验证。
- must-revalidate(针对代理服务器)：如果基于源服务器的Expire或max-age值，已缓存的响应超过max-age时间，缓存必须每次重验证。
- proxy-revalidate(针对用户终端)：类似于must-revalidate,但不适用于代理缓存。

（3）组合使用注意

Cache-Control:max-age,s-maxage;时，那么代理使用s-maxage进行缓存，浏览器使用max-age进行缓存。
Cache-Control:no-cache,max-age=60;时，max-age失效。
Cache-Control:no-cache,no-store;时，no-cache失效。
revalidate能与max-age能够配合使用，即max-age没过期，使用本地；过期则去重新获取。
单独使用revalidate时，浏览器或代理会有默认的max-age，不同的浏览器该值不一样（所以禁止这样使用）。
请一定要指定private public来指定允许缓存的代理或浏览器

（4）示例

服务器：Nginx
客户端：Chrome

# demo1
location / {
    add_header Cache-Control max-age=30;
    root   /home/nginx/html;
    index  index.html;
}

# demo2
location / {
    add_header Cache-Control private,max-age=30,proxy-revalidate;
    root   /home/nginx/html;
    index  index.html;
}

执行结果是一样的，max-age时间内，从本地获取，超出则访问服务器。
但是我强烈建议使用第二种，因为Chrome中两个的效果是相同的，鬼知道其他的浏览器会是怎样的体现。

六废弃和更新缓存的响应

HTML 被标记为“no-cache”，这意味着浏览器在每次请求时都始终会重新验证文档，并在内容变化时获取最新版本。此外，在 HTML 标记内，您在 CSS 和 JavaScript 资产的网址中嵌入指纹：如果这些文件的内容发生变化，网页的 HTML 也会随之改变，并会下载 HTML 响应的新副本。
允许浏览器和中间缓存（例如 CDN）缓存 CSS，并将 CSS 设置为 1 年后到期。请注意，您可以放心地使用 1 年的“远期过期”，因为您在文件名中嵌入了文件的指纹：CSS 更新时网址也会随之变化。
JavaScript 同样设置为 1 年后到期，但标记为 private，这或许是因为它包含的某些用户私人数据是 CDN 不应缓存的。
图像缓存时不包含版本或唯一指纹，并设置为 1 天后到期。

注：一般打包工具都具备给文件嵌入指纹，整个不需要担心。

如：Angualr项目打包生成项目结构

index.html
assets
    img
        logo.png
        ...
1.4f4fe517e78bb7b8a11d.js # 组件混淆文件
styles.2c73b882414fbdd03a9f.css
....

七缓存检查清单

使用一致的网址：如果您在不同的网址上提供相同的内容，将会多次获取和存储这些内容。
确保服务器提供验证令牌 (ETag)：有了验证令牌，当服务器上的资源未发生变化时，就不需要传送相同的字节。(Nginx自带Etag计算)
确定中间缓存可以缓存哪些资源：对所有用户的响应完全相同的资源非常适合由 CDN 以及其他中间缓存进行缓存。(Nginx进行定制)
为每个资源确定最佳缓存周期：不同的资源可能有不同的更新要求。为每个资源审核并确定合适的 max-age。(Nginx进行定制)
确定最适合您的网站的缓存层次结构：您可以通过为 HTML 文档组合使用包含内容指纹的资源网址和短时间或 no-cache 周期，来控制客户端获取更新的速度。(Angular打包自动支持)
最大限度减少搅动：某些资源的更新比其他资源频繁。如果资源的特定部分会经常更新，可以考虑将其代码作为单独的文件提供。这样一来，每次获取更新时，其余内容可以从缓存获取，从而最大限度减少下载的内容大小。

参考：

https://www.cnblogs.com/chyingp/p/no-cache-vs-must-revalidate.html
https://developers.google.com/web/fundamentals/performance/optimizing-content-efficiency/http-caching?hl=zh-cn
https://www.web-tinker.com/article/21217.html
https://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html#sec14.9
《HTTP权威指南》第7章
《图解HTTP》第6章

原文地址：https://www.cnblogs.com/linzhanfly/p/10008795.html

时间： 2024-11-25 16:01:43

HTTP协议探究（一）的相关文章

WebSocket协议探究（三）：MQTT子协议

一复习和目标 1 复习 Nodejs实现WebSocket服务器 Netty实现WebSocket服务器(附带了源码分析) Js api实现WebSocket客户端注:Nodejs使用的Socket.io模块实现,Netty本身对WebSocket有一定的支持,所以这两种实现都相对容易理解,大家自己可以使用自己喜欢的语言实现(参考Nodejs版本,即不需要考虑过多的情况). 2 目标使用WebSocket协议进行发送Mqtt消息即Mqtt协议作为WebSocket协议的子协议进行通信注

MQTT协议探究（三）

1 回顾与本次目标 1.1 回顾主题通配符主题语义和用法 WireShark进行抓包分析了报文报文分析: SUBSCRIBE--订阅主题 SUBACK--订阅确认 UNNSUBSCRIBE--取消订阅 UNSUBACK--取消订阅确认 PUBLISH--发布消息(Qos0,服务质量等级下一节再说吧) 1.2 本节目标服务质量等级 PUBLISH--发布消息(Qos1 Qos2) PUBACK--发布确认 PUBREC--发布收到 PUBREL--发布释放 PUBCOMP--发布完成 2

WebSocket协议探究（二）

一复习和目标 1 复习协议概述: WebSocket内置消息定界并且全双工通信 WebSocket使用HTTP进行协议协商,协商成功使用TCP连接进行传输数据 WebScoket数据格式支持二进制和文本初始握手和计算响应键值消息格式关闭握手 2 目标 Nodejs实现WebSocket服务器 Netty实现WebSocket服务器 Js api实现WebSocket客户端二 Nodejs实现WebScoket服务器 1 概述 Node.js 使用事件驱动, 非阻塞I/O 模型而得以轻

CoAP协议探究之调试插件copper

一.google浏览器安装插件copper 参考:http://www.cnblogs.com/liuyunxiang/p/8894596.html 二.copper调试CoAP协议 1.点击右上角copper按钮,输入coap://127.0.0.1:5683 2.启动上一篇博客中服务器端代码,点击Discover按钮 3.选中"CoAPTemperatureModel",点击GET,可以看到服务器端数据 4.依次可以选中服务器端预设的资源标识符,根据不同需求点击POST,PUT,D

MQTT协议探究（二）

1 回顾与本次目标 1.1 回顾 MQTT控制报文的基本格式 WireShark进行抓包分析了报文报文分析: CONNECT--连接服务器 CONNACK--确认连接请求 PINGREQ--心跳请求 PINGRESP--心跳响应 DISCONNECT--断开连接 1.2 本节目标 SUBSCRIBE--订阅主题 SUBACK--订阅确认 UNNSUBSCRIBE--取消订阅 UNSUBACK--取消订阅确认 PUBLISH--发布消息(Qos0,服务质量等级下一节再说吧) 2 MQTT控制报文

netty 对 protobuf 协议的解码与包装探究(2)

netty 默认支持protobuf 的封装与解码,如果通信双方都使用netty则没有什么障碍,但如果客户端是其它语言(C#)则需要自己仿写与netty一致的方式(解码+封装),提前是必须很了解netty是如何进行封装与解码的.这里主要通过读源码主要类ProtobufVarint32FrameDecoder(解码)+ProtobufVarint32LengthFieldPrepender(封装) 来解析其原理与实现. 文章来源http://www.cnblogs.com/tankaixiong

探究@property、@synthesize、@dynamic、readonly在类、分类、协议中的作用

@protocol StudentProtocol /** 在类里只会生成setter.getter方法的声明, 系统将不会自动生成对应属性的setter.getter方法的实现和成员变量 */ @property (nonatomic, assign) NSInteger age; @end @interface Student : NSObject <StudentProtocol> //打印日志 + (void)printTestInfo; /** 1.生成属性name 2.生成name

深入研究HTTP协议以及部分应用

引言工作了一段时间,都是在开发网页,自然和http打交道打得最多了,投身工作之后原来理解的东西又变得模糊,所以有必要深入探讨一下http协议的细节,也借此总结一下学习的成果. HTTP相关认识对HTTP的学术认识我可是总结不到位的,不过就实际应用来说,HTTP协议是对TCP协议的一个细化扩展(个人理解).TCP是一个可靠的面向连接的传输层协议,他指出两个通信端在通信时候保证通信正常进行的步骤,比如三次握手,比如传输的报文格式,这些规定了点到点的传输形式.而HTTP是基于TCP协议在应用层方向

探究PHP底层

探究PHP底层 1.PHP是什么? PHP 指的是我们从外面看到的一套完整的系统.这听起来有点糊涂,但其实并不复杂(PHP4 内部结构图).从功能上来分:我们可以分为三部分: 1. 解释器部分(Zend 以引擎),负责对输入代码的分析.翻译和执行: 2. 功能性部分(PHP功能函数以及扩展),负责具体实现语言的各种功能(比如它的函数等等): 3. 接口部分(SAPI),负责同 WEB 服务器的会话等功能. Zend包括了第一部分的全部和第二部分的局部,PHP内核包括了第二部分的局部和第三部分的