http请求原理

客户端发送一个HTTP请求到服务器的请求消息包括以下格式：请求行（request line）、请求头部（header）、空行和请求数据四个部分组成，下图给出了请求报文的一般格式。

请求行

HTTP响应也由四个部分组成，分别是：状态行、消息报头、空行和响应正文。

下面是一些最常见的请求头：

Accept：浏览器可接受的MIME类型。
    Accept - Charset：浏览器可接受的字符集。
    Accept - Encoding：浏览器能够进行解码的数据编码方式，比如gzip。Servlet能够向支持gzip的浏览器返回经gzip编码的HTML页面。许多情形下这可以减少5到10倍的下载时间。
    Accept - Language：浏览器所希望的语言种类，当服务器能够提供一种以上的语言版本时要用到。
    Authorization：授权信息，通常出现在对服务器发送的WWW - Authenticate头的应答中。
    Connection：表示是否需要持久连接。如果Servlet看到这里的值为“Keep - Alive”，或者看到请求使用的是HTTP 1.1（HTTP 1.1默认进行持久连接），它就可以利用持久连接的优点，当页面包含多个元素时（例如Applet，图片），显著地减少下载所需要的时间。要实现这一点，Servlet需要在应答中发送一个Content - Length头，最简单的实现方法是：先把内容写入ByteArrayOutputStream，然后在正式写出内容之前计算它的大小。
    Content - Length：表示请求消息正文的长度。
    Cookie：这是最重要的请求头信息之一，参见后面《Cookie处理》一章中的讨论。
    From：请求发送者的email地址，由一些特殊的Web客户程序使用，浏览器不会用到它。
    Host：初始URL中的主机和端口。
    If - Modified - Since：只有当所请求的内容在指定的日期之后又经过修改才返回它，否则返回304“Not Modified”应答。
    Pragma：指定“no - cache”值表示服务器必须返回一个刷新后的文档，即使它是代理服务器而且已经有了页面的本地拷贝。
    Referer：包含一个URL，用户从该URL代表的页面出发访问当前请求的页面。
    User - Agent：浏览器类型，如果Servlet返回的内容与浏览器类型有关则该值非常有用。
    UA - Pixels，UA - Color，UA - OS，UA - CPU：由某些版本的IE浏览器所发送的非标准的请求头，表示屏幕大小、颜色深度、操作系统和CPU类型。

HTTP状态码

当浏览者访问一个网页时，浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前，此网页所在的服务器会返回一个包含HTTP状态码的信息头（server header）用以响应浏览器的请求。

HTTP状态码的英文为HTTP Status Code。

下面是常见的HTTP状态码：

200 - 请求成功

301 - 资源（网页等）被永久转移到其它URL

404 - 请求的资源（网页等）不存在

500 - 内部服务器错误

·HTTP请求流程

首先，http属于Tcp/Ip模型中的应用层协议，而两个应用程序（我们这里指的就是浏览器与服务器）之间要进行互相通信，首先得建立Tcp连接，然后浏览器才能向服务器发送请求信息，服务器在接受到请求信息后，返回相应的应答信息，浏览器接收到来自服务器的应答信息后，对这些数据进行解释执行。

在http 1.0的版本中，浏览器的每次请求（也就是对每一个页面的访问）都要求建立一次单独的连接，在处理完每一次的请求后，就自动释放连接。（这点我们应该都有感觉，比如我们访问一个页面，当该页面在浏览器中显示出来的时候，我们可以拔掉网线，此时该页面上的信息并不会丢失。）而当我们请求的网页文件中有很多图片、音乐、电影等信息时，服务器返回的信息中并不直接包含图片数据，而只是保存该图片的链接，当浏览器进行解释的时候，遇到图片的url时,才向服务器发出对图片的请求信息。可见如果一个网页中包含多个图片数据时，将会频繁的与服务器建立连接，与释放连接，这无疑会造成资源的浪费。

http 1.0 请求模式

而http 1.1则可以在一次连接中处理多个请求，并且多个请求可以重叠进行，不需要等待一个请求结束后再发送下一个请求。

·HTTP请求消息

      1次完整的http请求消息包括：一个请求行、若干消息头以及实体内容，而消息头和实体内容可以没有，消息头和实体内容间有一个空行。
      我们来看一个例子（为了便于说明，我在每行前加了序号）：
            1 Get /mattmarg/ HTTP/1.0
            2 User-Agent: Mozilla/2.0 (Macintosh; I; PPC)
            3 Accept: text/html; */*
            4 Cookie: name = value
            5 Referer: http://www.XXX.com/a.html
      其中，第1行就是请求行：请求方式为Get（除了Get之外，还有Post、Put、Delete方式），请求的文件位于"根目录/mattmarg/"下，当然也可以直接给出需要的页面（如：/mattmarg/index.asp，也可以加上一些其它字段如：/mattmarg/index.asp？id=1&uid=xxx。当我们通过Get请求时，提交给服务器的请求行长度不能超过1K,而如果利用Post方式，则是把所提交的信息以实体内容形式发送给服务器，所以如果服务器没有限制的话，原则上讲可以传输无限大的内容），HTTP/1.0 表示了http的版本为1.0。其余几行就是消息头了，消息头主要是用来向服务器传达某种信息或指示。如告诉服务器自己的终端（User-Agent）是什么(如果是浏览器则返回相应的浏览器型号),终端所可以解释的类型（Accept）是什么，是从哪个页面提交的请求（Referer），以及浏览器所能解释的语言（Accept-Language）等等。我们这里拿Accept-Language来举个例子，大家都知道google在中国大陆显示的是简体中文，而在其它的国家则显示对应的语言，这个是怎么做到的呢？其实就是浏览器向服务器递交的请求信息中包含了Accept-Language,而我们的浏览器默认是zh-cn,然后服务器在接受到该信息时返回对应的页面。
      我们可以通过以下方法来验证一下：
      1、打开浏览器->工具->internet选项->常规选项卡

2、选择"语言"，可见默认的语言是中文

3、选择"添加"，选择一种语言，然后调节一下优先顺序

4、确定之后，我们再访问一下http://www.google.com/，是不是发现原来的简体中文全都成了繁体字了。

·HTTP响应消息

      Http响应消息的格式为：一个状态行、若干消息头和实体内容，其中消息头和实体内容可以没有，消息头和实体内容间有一个空行。
      我们依旧先来看一个例子：
            01 HTTP/1.1 200 OK
            02 Server: Microsoft-IIS/5.1
            03 X-Powered-By: ASP.NET
            04 Date: Sun, 06 Jul 2008 11:01:21 GMT
            05 Content-Type: text/html
            06 Accept-Ranges: bytes
            07 Last-Modified: Wed, 02 Jul 2008 01:01:26 GMT
            08 ETag: "0f71527dfdbc81:ade"
            09 Content-Length: 46
            10
            11 <html><head></head><body>adfasfa</body></html>
      其中，01行是状态行，用于显示服务器响应的状态，HTTP/1.1显示了对应的http协议版本，200为状态数字，OK为状态信息用于解释状态数字（这里OK对应200，表示请求正常）；02~09是消息头部分，10为空行，11为实体内容（也就是服务器返回的网页内容）。

好了，相信大家应该已经对这个http请求的流程有了一个大概的了解了吧，那么我们反过来回答下最初留下的问题:当我们在浏览器的地址栏中输入 "http://www.baidu.com/ " ，然后按"回车"，这之后发生了什么事？。

首先，浏览器找到该网址所指向的IP，然后与其建立TCP连接，接着向百度服务器提出Get请求，当服务器接收到我们的请求后，向我们传送应答信息--百度的页面,然后断开连接。

参考：http://www.cnblogs.com/stg609/archive/2008/07/06/1236966.html

时间： 2024-08-05 04:15:23

http请求原理

http请求原理的相关文章

前端跨域请求原理及实践

Tomcat7.0源码分析——请求原理分析（中）

Tomcat源码分析——请求原理分析（下）

.net学习之母版页执行顺序、jsonp跨域请求原理、IsPostBack原理、服务器端控件按钮Button点击时的过程、缓存、IHttpModule 过滤器

Tomcat7.0源码分析——请求原理分析（上）

Asp.Net请求原理and页面生命周期

Tomcat源码分析——请求原理分析（中）

Tomcat7.0源码分析——请求原理分析

深入理解jsonp跨域请求原理