TCP连接
世界上几乎所有的 HTTP 通信都是由 TCP/IP 承载的, TCP/IP 是全球计算机及网络
设备都在使用的一种常用的分组交换网络分层协议集。 客户端应用程序可以打开一
条 TCP/IP 连接, 连接到可能运行在世界任何地方的服务器应用程序。 一旦连接建
立起来了, 在客户 端和服务器的计算机之间 交换的报文就永远不会丢失、 受损或
失序。尽管报文不会丢失或受损, 但如果计算机或网络崩溃了, 客户端和服务器之间的通信仍然会被断开。
在这种情况下, 会通知客户端和服务器通信中断了。
TCP 为 HTTP 提供了一条可靠 的比特传输管道。 从 TCP 连接一端填入的字节会从另
一端以原有的顺序、 正确地传送出来
HTTP 要传送一条报文时, 会以流的形式将报文数据的内容通过一条打开的 TCP 连
接按序传输。 TCP 收到数据流之后, 会将数据流砍成被称作段的小数据块, 并将段
封装在 IP 分组中, 通过因特网进行传输 所有这些工作都是由 TCP/
IP 软件来处理的, HTTP 程序员什么都看不到。
每个 TCP 段都是由 IP 分组承载, 从一个 IP 地址发送到另一个 IP 地址的。 每个 IP
分组中都包括:
• 一个 IP 分组首部(通常为 20 字节) ;
• 一个 TCP 段首部(通常为 20 字节) ;
• 一个 TCP 数据块( 0 个或多个字节)。
IP 首部包含了源和目 的 IP 地址、 长度和其他一些标记。 TCP 段的首部包含了 TCP
端口 号、 TCP 控制标记, 以及用于数据排序和完整性检查的一些数字值。
保持TCP连接的正确运行
在任意时刻计算机都可以有几条 TCP 连接处于打开状态。 TCP 是通过端口 号来保持
所有这些连接的正确运行的。
端口 号和雇员使用的电话分机号很类似。 就像公司的总机号码能将你接到前台, 而
分机号可以将你接到正确的雇员 位置一样, IP 地址可以将你连接到正确的计算机,
而端口 号则可以将你连接到正确的应用程序上去。 TCP 连接是通过 4 个值来识别的:
< 源 IP 地址、 源端口 号、 目 的 IP 地址、 目 的端口 号 >
这 4 个值一起唯一地定义了一条连接。 两条不同的 TCP 连接不能拥有 4 个完全相同
的地址组件值(但不同连接的部分组件 可以拥有相同的值)
HTTP 事务的时延有以下几种主要原因。
(1 ) 客户端首先需要根据 URI 确定 Web 服务器的 IP 地址和端口 号。 如果最近没有对
URI 中的主机名进行访问, 通过 DNS 解析系统将 URI 中的主机名转换成一个 IP
地址可能要花费数十秒的时间 3。
(2) 接下来, 客户端会向 服务器发送一条 TCP 连接请求, 并等待服务器回 送一个请
求接受应答。 每条新的 TCP 连接都会有连接建立时延。 这个值通常最多只有一
两秒钟, 但如果有数百个 HTTP 事务的话, 这个值会快速地叠加上去。
(3) 一旦连接建立起来了, 客户 端就会通过新建立的 TCP 管道来发送 HTTP 请求。
数据到达时, Web 服务器会从 TCP 连接中 读取请求报文, 并对请求进行处理。因特网传输请求报文,
以及服务器处理请求报文都需要时间。
(4) 然后, Web 服务器会回送 HTTP 响应, 这也需要花费时间。
这些 TCP 网络时延的大小取决于硬件速度、 网络和服务器的负载, 请求和响应报文
的尺寸, 以及客户端和服务器之间的距离。 TCP 协议的技术复杂性也会对时延产生
巨大的影响。
最常见的 TCP 相关时延,
其中包括:
• TCP 连接建立握手;
• TCP 慢启动拥塞控制;
• 数据聚集的 Nagle 算法;
• 用于捎带确认的 TCP 延迟确认算法;
• TIME_WAIT 时延和端口 耗尽。
TCP 连接握手需要经过以下几个步骤。
(1) 请求新的 TCP 连接时, 客户端要向服务器发送一个小的 TCP 分组(通常是 40 ~
60 个字节)。 这个分组中设置了一个特殊的 SYN 标记, 说明这是一个连接请求。
(2) 如果服务器接受了 连接, 就会对一些连接参数进行计算, 并向 客户端回 送一个
TCP 分组, 这个分组中 的 SYN 和 ACK 标记都被置位, 说明连接请求已被接受。
(3) 最后, 客户端向服务器回送一条确认信息, 通知它连接已成功建立。
现代的 TCP 栈都允许客户端在这个确认分组中发送数据。
程序员永远不会看到这些分组——这些分组都由 TCP/IP 软件管理, 对其是不
可见的。 HTTP 程序员看到的只是创建 TCP 连接时存在的时延。
通常 HTTP 事务都不会交换太多 数据, 此时, SYN/SYN+ACK 握手会产生一个可测量的时延。
TCP 连接的 ACK 分组 通常都足够大, 可以承载整个 HTTP 请求报文, 而且很多 HTTP 服务器响应报文都可
以放入一个 IP 分组中 去( 比如, 响应是包含了装饰性图 片的小型 HTML 文件, 或
者是对浏览器高速缓存请求产生的 304 Not Modified 响应)。