HTTP If-Modified-Since引发的浏览器缓存汇总

在看Spring中HttpServlet的Service方法时，对于GET请求，代码逻辑如下：

if (method.equals(METHOD_GET)) {
            long lastModified = getLastModified(req);
            if (lastModified == -1) {
                // servlet doesn‘t support if-modified-since, no reason
                // to go through further expensive logic
                doGet(req, resp);
            } else {
                long ifModifiedSince;
                try {
                    ifModifiedSince = req.getDateHeader(HEADER_IFMODSINCE);
                } catch (IllegalArgumentException iae) {
                    // Invalid date header - proceed as if none was set
                    ifModifiedSince = -1;
                }
                if (ifModifiedSince < (lastModified / 1000 * 1000)) {
                    // If the servlet mod time is later, call doGet()
                    // Round down to the nearest second for a proper compare
                    // A ifModifiedSince of -1 will always be less
                    maybeSetLastModified(resp, lastModified);
                    doGet(req, resp);
                } else {
                    resp.setStatus(HttpServletResponse.SC_NOT_MODIFIED);
                }
            }

        }

其中涉及的关键信息是修改时间，这就涉及到浏览器数据缓存问题。以下对个缓存机制进行简单总结，可用于请求的优化。（本文中的图都摘自其他文章）

Last-Modified和If-Modified-Since

当浏览器GET请求的时候，如果有If-Modified-Since，则会与当前服务器上相关资源最后一次修改时间进行对比，如果相同则返回304（资源可访问，但没修改），否则加载最新数据，浏览器再缓存起来。这样减少网络数据传输和服务器压力。

ETags和If-None-Match

根据修改时间判断文件是否被修改，如果一个网页被频繁更新，但实际内容并没有更新，依然会对服务器造成压力。引入了ETags和If-None-Match，其不同于Last-Modified和If-Modified-Since取决于修改时间，可以依赖其他属性，如资源的MD5等。当资源被更新，但实际内容没有更新，则会比较修改时间和ETags，如果ETags没变，则不更新数据资源。但查阅源码戴发现，目前底层实现上实现的是弱Etags，其由文本长度和修改时间组成，资源被更新后，ETags依然会更新。在AbstractResource中，代码如下：

  @Override
    public final String getETag() {
        if (weakETag == null) {
            synchronized (this) {
                if (weakETag == null) {
                    long contentLength = getContentLength();
                    long lastModified = getLastModified();
                    if ((contentLength >= 0) || (lastModified >= 0)) {
                        weakETag = "W/\"" + contentLength + "-" +
                                   lastModified + "\"";
                    }
                }
            }
        }
        return weakETag;
    }

Expires

添加Expires头能有效的利用浏览器的缓存能力来改善页面的性能，能在后续的页面中有效避免很多不必要的Http请求，WEB服务器使用Expires头来告诉Web客户端它可以使用一个组件的当前副本，直到指定的时间为止。例如：Expires：Thu，15 Apr 2010 20：00：00 GMT; 他告诉浏览器缓存有效性持续到2010年4月15日为止，在这个时间之内相同的请求使用缓存，这个时间之外使用http请求。Expires有一个非常大的缺陷，它使用一个固定的时间，要求服务器与客户端的时钟保持严格的同步，并且这一天到来后，服务器还得重新设定新的时间。