HTTP 报文结构

  HTTP位于五层模型中的应用层,是传输层(代表为TCP协议)的上层协议。

之前我们通过 socket 实现了使用 TCP 协议进行数据收发:手写一个模块化的 TCP 服务端客户端 ,对 TCP 协议的使用有了一个初步的认识。

  简单的说,IP 协议 帮助我们的数据包在复杂的网络环境下进行寻址,但并不能保证数据包一定可以到达目的地。因为传输环境或网络可能会非常复杂,我们并不能保证路由算法在所有场景下都可以准确的到达目的地,加上为了避免冗余数据包滞留网络对网络造成破坏,IP 协议中还存在最大跃点数等数据销毁机制。因此 IP 协议仅负责寻址,不负责到达。

  所以仅通过 IP 协议进行通信是不可靠的,TCP 协议位于 IP 协议的上层,通过 ACK 确认机制帮助我们在 IP 协议的基础上建立了可靠的数据通道。

  但 TCP 协议还是不能满足我们的通信要求,因为它是无界的。这使得我们无法将数据与请求联系起来,如果我们发送多次请求,请求的数据无间隔的到达或被封装在同一个数据包里到达的话,我们无法单纯的靠 TCP 协议确定某段数据属于哪次请求,也就是会出现所谓的粘包和半包问题。

  HTTP 帮我们解决了这个问题,它从数据层面帮助我们对请求进行了定界,进一步满足了我们的通信需求。

  整个网络分层模型就是一个责任链模式的典型代表,每层专注解决一类问题后将数据扔给下一层,直到到达我们的应用,使我们可以得到能直接能应用于业务的数据。

  HTTP 在传输层上层约定了数据的传输格式,搞懂报文格式才能理解其解析机制,当然要看全面的报文格式最好的方式当然是去查阅 RFC 文档,这里我们只介绍其主要部分。

  HTTP报文分为请求报文和响应报文,二者的基本格式是相同的。

  请求报文的格式:

  <method> <request-URL> <version>

  <headers>

  <entity-body>

  响应报文的格式

  <version><status><reason-phrase>

  <headers>

  <entity-body>

  method: 表示请求方法,如 GET/POST 。
  request-URL: 为请求的资源路径。

  version: 表示使用的协议版本号,如1.0/1.1等。
  status-code: 表示请求的状态码,描述请求过程中发生的情况,比如 200:成功;500:服务器端异常 等。

  reason-phrase: 表示原因短语,无特殊含义,类似我们平时设计表结构时设计的 remark 备注字段。

  header:请求首部。每个请求可以有零个或多个首部,每个首部都是一个键值对外加一个可选的空格。所有首部的最后由一个空行 CRLF 标识首部的结束。

  entity-body:请求的实体部分。包含着我们请求的数据,但并不是我们所有的请求参数都会在请求实体中,请求实体可为空,也是以一个空行 CRLF 标识结束。

  每个 HTTP 报文都是以一个起始行作为开始的。请求报文的起始行标明我要干什么,响应报文的起始行标明发生了什么。

  响应报文的起始行则没有 url 和请求方法。

  无论请求报文还是响应报文,其各字段间均是通过空格进行分隔的。

  响应报文中的状态码可以向请求者说明该次请求发生了什么事情。我们比较熟悉的状态码比如 404/302/500/200 等都属于响应报文的状态码。

  原因短语是方便我们阅读的状态码的可读版本,比如 200 后面跟的 OK 便是 200 的原因短语。  

  HTTP 首部用于向请求和响应的报文中添加一些额外的信息。HTTP规范定义了一些固定的首部字段,当然我们也可以随意添加自己定义的首部字段。

  首部有以下几种分类:

  通用首部:即可出现在请求报文中,也可出现在响应报文中
  请求首部:提供更多有关请求的信息
  响应首部:提供更多有关响应的信息
  实体首部:描述主体的长度和内容,或者资源本身
  扩展首部:规范中没有定义的新首部

  这样一来,首部可能会有比较多的附加字段,将长的首部行分为多行可以提高可读性,多出来的每行前面至少要有一个空格或制表符(tab)。

  以上是对 HTTP 协议组成部分比较粗粒度的介绍,下次我们基于其报文结构,在 TCP 通信框架上层手写一个解析 HTTP 报文的 Handler 。

 

原文地址:https://www.cnblogs.com/niuyourou/p/12578532.html

时间: 2024-07-30 22:45:39

HTTP 报文结构的相关文章

http的报文结构和状态码的含义

HTTP响应报文解剖 响应报文结构 HTTP的响应报文也由三部分组成(响应行+响应头+响应体): 以下是一个实际的HTTP响应报文: ①报文协议及版本: ②状态码及状态描述: ③响应报文头,也是由多个属性组成: ④响应报文体,即我们真正要的“干货”. 响应状态码 和请求报文相比,响应报文多了一个“响应状态码”,它以“清晰明确”的语言告诉客户端本次请求的处理结果. HTTP的响应状态码由5段组成: 1xx 消息,一般是告诉客户端,请求已经收到了,正在处理,别急... 2xx 处理成功,一般表示:请

TCP报文结构和长短连接

参考博文: https://www.cnblogs.com/onlysun/p/4520553.html https://blog.csdn.net/zxy987872674/article/details/52653101 一.报文结构介绍 在开始讲TCP连接过程时,还是先看看TCP报文的格式如图1所示.IP数据报此时由IP头部+TCP头部+TCP数据组成.不带选项的TCP头部是20字节长,而带选项的,TCP头部最长可达60字节.常见的选项包括最大的大小(MSS),时间戳(传输控制时使用).窗

HTTP报文结构及Cookie、session区别

目录 万维网 HTTP超文本传输协议 特点 HTTP的报文结构. 下面介绍http请求报文最主要的一些特点 在服务器上存放用户的信息(Cookie) 实例: 工作原理: cookie中的主要内容: Cookie的作用: Cookie的缺陷: Session详解 简介: 工作原理: 作用 Cookie和session的区别 万维网 HTTP超文本传输协议 为了使万维网客户程序与万维网服务器程序之间的交互遵守严格的协议,因此诞生了HTTP超文本传输协议. 特点 位于OSI七层模型的应用层,http是

http报文结构

1.HTTP报文 那么什么是HTTP报文呢? HTTP报文是用于HTTP协议交互的信息,HTTP报文本身是由多行数据构成的字符串文本. 请求报文和响应报文 HTTP通信过程包括客户端往服务器端发送请求以及服务器端给客户端返回响应两个过程. 客户端往服务器端发送请求时的报文叫做请求报文. 服务器端接受客户端请求后,返回给客户端的报文叫做响应报文 2.请求报文及响应报文的结构 不管是请求报文还是响应报文,都由起始行,报文头域, 空行, 报文主体构成 HTTP报文结构如图: 起始行 报文头域 空行 报

网络协议报文结构与抓包示例

TCP/IP的分层 OSI的分层 以太网帧抓包看到的结构如下图: IP数据报文 以太网帧抓包看到的结构如下图: TCP数据报文 TCP报文抓包看到的结构如下图: UDP数据报文 UDP报文抓包看到的结构如下图:

学习整理——以太帧、ip帧、udp/tcp帧、http报文结构

从最简单的一个http请求开发,根据TCP/IP协议,分开来看每一层的数据帧结构,以及它们是怎样承担起网络服务的. 协议栈 因特网协议栈共有五层: 1.应用层,是网络应用程序及其应用层协议存留的地方.因特网的应用层包括许多协议,常见的有HTTP(它为web文档提供了请求和传送).SMTP(它提供了电子邮件报文的传输)和FTP(它提供了两个端系统之间的文件传送). 2.传输层,负责为信源和信宿提供应用程序进程(包括同一终端上的不同进程)间的数据传输服务,这一层上主要定义了两个传输协议,传输控制协议

TCP报文结构

固定首部长度为20字节,可变部分0~40字节,各字段解释: source port number:源端口,16bits,范围0~65525. target port number:目的端口,16bits,范围同上. sequence number:数据序号,32bits,TCP 连接中传送的数据流中的每一个字节都编上一个序号.序号字段的值则指的是本报文段所发送的数据的第一个字节的序号. acknoledgement number:确认号,32bits,期望收到对方的下一个报文段的数据的第一个字节

HTTP报文结构和内容(转)

HTTP请求报文格式就如下图所示: 1. 请求报文 一个HTTP请求报文由请求行(request line).请求头部(header).空行和请求数据4个部分组成. 大致结构是这样的: <request-line> //请求行 <headers> //首部行 <blank line> //空行 <request-body> //请求体 一个简单的例子: POST /user HTTP/1.1 //请求行 Host: www.user.com Content-

HTTP协议的报文结构

HTTP 有两类报文: (1) 请求报文----从客户向服务器发送请求报文,见图6-12(a). (2) 响应报文----从服务器到客户的回答,见图6-12(b). 由于 HTTP是面向文本的(text-oriented),因此在报文中的每一个字段都是一些ASCII码串,因而每个字段的长度都是不确定的. HTTP请求报文和响应报文都是由三个部分组成.可以看出,这两种报文格式的区别就是开始行不同. (1) 开始行 用于区分是请求报文还是响应报文.在请求报文中的开始行叫做请求行(Request-Li