超文本传输协议(HTTP,HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议。HTTP 也属于 TCP/IP 协议族的子集,想要学习 HTTP ,先需要了解 TCP/IP。
1 - TCP/IP 的分层管理
TCP/IP 协议族里重要的一点就是分层,按层次分为以下4层:应用层、传输层、网络层 、数据链路层。
层次化的好处是,各层之间的协议改变可以互不影响,只需要按照接口规划好。
- 应用层
应用层决定了向用户提供应用服务时通信的活动。TCP/IP 协议族内预存了各类通用的应用服务。
包括 HTTP,FTP(File Transfer Protocol,文件传输协议),DNS(Domain Name System,域名系统)服务。
- 传输层
传输层提供处于网络连接中的两台计算机之间的数据传输。
有两个性质不同的协议:TCP(Transmission Control Protocol,传输控制协议)和UDP(User Data Protocol,用户数据报协议)
- 网络层
网络层用来处理在网络上流动的数据包,数据包是网络传输的最小数据单位。该层规定了通过怎样的路径到达对方计算机,并把数据包传送给对方。
与对方计算机之间通过多台计算机或网络设备进行传输时,网络层所起的作用就是在众多的选项内选择一条传输路线。
- 链路层
用来处理连接网络的硬件部分。硬件上的范畴均在链路层的作用范围之内。
2 - TCP/IP 通信传输流
如图1所示,发送端在层与层之间传输数据时,每经过一层时必定会被打上一个该层所属的首部信息。反之,接收端在层与层传输数据时,每经过一层时会把对应的首部消去。
这种把数据信息包装起来的做法成为封装。
图1 - HTTP通信传输过程
3 - 与 HTTP 关系密切的协议:IP、TCP 和 DNS
- 3.1 负责传输的 IP 协议
IP(Internet Protocol)网际协议位于网络层。其作用是把各种数据包传送给对方,需要满足各类条件,最重要的两个条件便是 IP 地址 和 MAC 地址。IP 地址可以和 MAC 地址进行配对,IP 地址可变换,但 MAC 地址基本不会更改。
在网络上,通信的双方在同一局域网(LAN)内的情况是很少的,通常是经过多台计算机和网络设备中转才能连接到对方。而在进行中转时,会利用下一站中转设备的 MAC 地址来搜索下一个中转目标。这时,会采用 ARP (Address Resolution Protocol)协议。 ARP 是一种用以解析地址的协议,根据通信方的 IP 地址就可以反查出对应的 MAC 地址。 - 3.2 确保可靠性的 TCP 协议
TCP 位于传输层,提供可靠的字节流服务。字节流服务是指将大块数据分割成报文段(segment)为单位的数据包进行管理
为了保证准确性,TCP 协议采用了三次握手(three-way handshaking)策略。握手过程中使用了 TCP 的标志(flag)—— SYN(synchronize)、ACK(acknowledgement)和 FIN(finish)。
TCP建立连接—三次握手:发送端首先发送一个带SYN标志的数据包给对方。接收端收到后,回传一个带有 SYN/ACK 标志的数据包以示传达确认信息。最后,发送端再回传一个带 ACK 标志的数据包,代表“握手”结束,过程见图2。
图2 - TCP建立连接—三次握手
TCP释放连接—四次握手:发送端首先发送一个带 FIN 标志的数据包给对方,然后进入 FIN-WAIT-1 状态。接收端收到后不能立即断开连接(防止数据丢失),先发送带 ACK 标志的数据包,此时发送端进入 FIN-WAIT-2 状态。然后接收端将没有传输完的数据继续传完,传完之后发送一个带 ACK 和 FIN 标志的数据包,通知发送端。发送端发送 ACK 标志的数据包给接收端,并进入 TIME-WAIT 状态,等待 2MSL 后断开连接。
图3 - TCP释放连接—四次握手
- 3.3 负责域名解析的 DNS 服务
DNS (Domain Name System)服务是和 HTTP 协议一样位于应用层的协议。它提供域名到 IP 地址之间的解析服务。用户通常通过主机名或域名来访问对方的计算机,计算机则通过 IP 地址查询服务器。所以 DNS 就提供了域名查找 IP 地址和从 IP 地址反查域名的服务。
上述三种协议在 HTTP 通信过程中的作用可以用一张图来表示:
图4 - HTTP 通信过程中各协议的作用