TCP协议的那些事(总结篇)

传输层概述

传输层概述

TCP协议特点:面向连接、字节流、可靠传输

面向链接:

1.使用TCP协议的双方必须先建立连接,并且双方都必须分配相应的内核资源。TCP的连接是全双工的,也就是说双方可以根据一个连接进行读写操作。

字节流:

1.当发送方应用多次进行写操作的时候,TCP发送模块会先把数据放在发送缓冲区中,当TCP发送模块真正发送的时候,这些在发送缓冲区中的数据才可能被封装成一个或多个报文段发出。所有根据以上结论,应用程序执行的写操作的次数和TCP发送的报文段个数没有对应的数量关系。

2.当接收端收到一个或多个报文段数据后,TCP模块必须把它们携带的应用层数据必须按照报文段序号把它们放到TCP接受缓冲区中。同时通知应用程序读取数据,这样应用程序就可以一次读出数据或多次读出数据,这取决于应用程序读缓冲区的大小。根据以上结论得出,TCP读取操作的次数跟接收报文段个数也没有固定的关系

总结:发送端执行的写操作次数与接受端的读操作次数没有任何数量关系,应用程序的发送和接收是没有边界限制的,UDP就不是这样,在这里不详细说了

如图TCP字节流服务过程:

以上就是字节流服务过程:

从图中我们就可以看见,发送短调用的发送次数,和接收短的接受次数并不一样。所有的数据都是先进入缓冲区,在进行操作。封装成报文段进行发送或接收。

可靠传输

TCP协议是可靠的传输协议,支持这种可靠传输的机制有:

  • 发送应答机制:也就是说发送端发送的每个数据报文段都必须得到接收方的应答。
  • 超时从穿机制:也就是说发送端在发送报文段数据后,本身就启动计时器,如果在规定时间内没有接到接受端的应答,那么就会重新发送这段数据。

要了解TCP在整个TCP协议栈中的作用我们需要分析一下TCP头部结构:

  • 头部结构出现在每个TCP报文段中
  • 头部结构包括20个字节的固定结构和40个字节的头部选项字段
  • 16位源端口:该报文段数据来自哪里?
  • 16位目的端口:该报文段数据传给哪个上层协议或应用程序。客户端基本使用临时端口号,而服务器选择知名的服务端口号,在Linux下,所有的知名服务端口号都定义在/etc/services文件夹下。

    HTTP服务端口号为80,DNS服务端口号为53,FTP服务器端口为21。

  • 32位序号:在tcp一次通信中(从建立连接到断开),在TCP协议在发送数据时会根据实际传输能力把数据分割成若干数据段,这32位序列号就是为这个数据段打上标记。
  • 32位确认号:如果接收端没有接收到某一段数据会告诉发送端:“我没收到这段数据 请重新发送” 所以用确认号能保证数据的完整性
  • 4位头部长度:标识有多少个4字节
  • URG:紧急指针是否有效
  • ACK:表示确认号是否有效
  • PSH:提示接收端应用程序应该立即从接收缓冲区中读取数据,为接收后续数据腾出空间。
  • RST:要求对方重新建立连接。
  • SYN:请求建立一个连接
  • FIN:同对方本端要关闭连接。
  • 16位窗口大小:TCP流量控制。
  • 16位校验和:接受端对tcp数据进行CRC算法检验tcp报文段在发送的过程中属否损坏。(包括数据部分)
  • 16位紧急指针:表示最后一个紧急数据的下一字节的序号。
  • 头部选项:最多包涵40个字节

1.kind:说明选项类型。

2.length:表示该选项的总长度。

3.info:选项的具体信息。

kind类型如图所示:

TCP连接状态转移过程

服务器典型状态转移过程

1、首先服务器通过LISTEN系统调用,进入LISTEN状态,表示被动打开,被动等待客户端的连接,服务器监听到某个客户端的连接请求后,这个连接请求被称为同步报文段。之后TCP会将其放到内核等待队列中,并向客户端发送带SYN的确认报文段,之后该连接就会处于SYN_RCVD状态。那么这个时候如果服务器收到了客户端的ACK确认报文段,服务器进入ESTABLISHED,这个状态可以让双方进行数据传输。

服务器关闭状态的转移过程

1、当客户端主动关闭连接时,客户端主动调用CLOSE,服务器接收到客户端的关闭报文段后,服务器返回ACK确认报文段,是连接进入CLOSE_WAIT状态。这个状态的就是跟字面意思一样,等待服务器关闭连接。这个时候服务器也会给客户端发送一个结束报文段,这个时候进入LAST_ACK。接下来就是等待客户端结束连接的最后一次确认。

客户端连接状态转移过程

1、首先客户端通过CONNECT系统调用,给服务器发送同步报文段。使系统进入YSN_SENT状态。接下来会有两种可能,如果连接失败,该连接将会恢复到CLOSED状态,如果该客户多收到服务器返回的同步报文段,确认报文段,说明该客户端成功连接服务器。连接转移到ESTABLISHED状态(功能通上)

当客户端进行关闭时的状态转移过程

1、当客户端关闭时,客户端发送一个关闭连接报文段,同时连接进入SFIN_WAIT_1状态,如果接收到服务端ACK确认,连接状态进入FIN_WAIT_2状态。当服务端也发送了结束报文段,那么客户端也会发送ACK确认,客户端进入TIME_WAIT状态。

如图为TCP连接状态转移图:

参照图片详细了解连接转移过程

TCP建立连接和关闭连接的过程

首先我们来回顾下我们以前了解过的,TCP头部结构有6个标识位

  • SYN:仅在三次握手建立连接时有效,表示同步报文段。
  • ACK:对TCP请求的确认标志。
  • FIN:标志用来结束一个TCP连接,标识此报文段是一个结束报文段

以上就是我们讲到以下内容的时候需要用到的知识点

三次握手建立连接

开始介绍一下三次握手的过程:

  • 第一次握手:其实是客户端发送一个带有SYN的数据报文段发送给服务器,对应在图片中就是从主机A->主机B(SYN=1,seq=i),seq为对应序列号为i。之后主机A进入SYN_SENT状态。同时等待服务器的确认
  • 第二次握手:服务器收到同步报文段后(也就是带有SYN的同步报文段),必须确定客户的同步报文段。然后自己也发送一个带有SYN的报文段,对应到图片中也就死第二个报文段,其中SYN=1,表示这是一个同步报文段,ACK=1,表示这是一个确认报文段,确认序号值为i+1,序号值为j。
  • 第三次握手:这次就是客户端收到确认同步报文段后,它向服务器发送确认包,对应到图片中也就是第三个报文段,ack=1也就是表示这是一个确认报文段,确认序号为j+1

三次握手建立后,客户端与服务器开始传送数据。

三次握手示意图:

四次握手关闭连接

接下来,我们来介绍下四次握手关闭

  • 第一次握手:表示客户端A发送给服务器一个带有SYN的结束报文段,用来关闭客户端A到服务端B的数据传送,对应到图片中也就是第一个报文段,FIN=1,seq=i,表示一个结束报文段
  • 第二次握手:服务端B接收到这个结束报文段后,它返回一个确认报文段,对应到图片中就是第二个确认报文段。其中ACK=1,ack=i+i,表示一个确认报文段,确认序号为i+1.
  • 第三次握手:服务器B关闭与客户端A的连接,他发送一个带有SYN结束报文段,对应图片上第三个报文段,其中 SYN=1,seq=j,表示结束报文段,序号为j。
  • 第四次握手:客户端A返回一个确认报文段,其中确认序号为j+1,对应图片上为第四个报文段,ACK=1,ack=j+1。

总结:为什么建立连接需要三次握手?为什么关闭连接需要四次握手?为什么建立连接需要三次握手呢?

  • 接受连接缺需要4次握手,LISTEN状态下建立连接后,它可以把同步报文段和确认报文段合并成一个报文段来进行发送,确认报文段起到应达作用,同步报文段起到同步作用,也就是三次握手中的第二个报文段其实是发挥了两个作用
  • 在关闭连接时,当收到对方的结束报文段时,表示对方没有数据发给你了,但是自己的数据未必全部发送完毕,所以你可能还需要继续发送一些数据之后在发送结束报文段给对方了表示你同意现在可以断开连接,所以关闭连接需要四次握手
  • 如果把三次握手改成两次握手,就有可能发生死锁。关于死锁,(搜索一下)

四次握手示意图:

TIME_WAIT状态的含义

在TCP详解(二)中,提到过,当客户端收到服务器的结束报文段后,不会立即进入CLOSED状态,而是转移到TIME_WAIT状态下,在这个状态下,客户端要等待一段2倍的MSL(报文段最大生存时间)时间。等待这个时间后才能完全关闭。TIME_WAIT状态的持续时间是MSL的2倍,这就足以让某个方向上的分组最多存活msl秒即被丢弃,另一个方向上的应答最多存活msl秒也被丢弃。 通过实施这个规则,我们就能保证每成功建立一个TCP连接时。来自该链接先前化身的重复分组都已经在网络中消逝了。

TIME_WAIT状态存在的原因有两点:

  • 可靠的终止TCP连接:

    例如在四次握手时,如果第三个报文段丢失,这个时候服务器将重新发送这个报文段,所以客户端需要停留在摸个状态来处理重复信息。否则客户端将会向服务器发送复位报文段,让服务器误认为这是一个错误

  • 保证延迟来的TCP报文段有足够的时间去识别并丢弃:

    在Linux系统上,一个TCP端口不能被同时打开多次,当一个TCP连接处于TIME_WAIT状态时,我们将无法立即使用该连接占用的端口建立一个新连接。

    但是我们反过来考虑,如果不存在这种机制,那么服务器刚关闭连接,又建立了一个类似的连接,成为“原链接化身”,这个“化身“就有可能就收到属于原来连接的数据报文段,这种情况是不允许出现的。

IME_WAIT状态过多的缺点:

  • 根据上诉,我们可以了解到,如果IME_WAIT状态过多会占用大量的端口号,占用系用资源

IME_WAIT状态过多的处理方法

  • 修改内核参数
  • 尽可能被动关闭连接
  • 将长连接修改为短连接
  • 通过套接字选项尽可能回避IME_WAIT状态带来的负面影响

RST复位报文段

RST复位报文段的作用

曾经在TCP协议详解(一)中介绍了TCP的头部信息,头部中有6位的标识字段,这6位中有一位时RST标志位。如果在TCP某一个报文段中,RST的标志位=1,就说明这个报文段是RST报文段,也就是复位报文段,在某些情况下,TCP连接的一端会像另一端发送携带RST数据报文段,用来通知对方关闭连接或者重新连接。

RST报文段是请求对方连接,发送此报文段的时机有:

  • 在连接建立时
  • 在中间发送数据时
  • 在连接关闭时

以上三种情况都有可能发送RST复位报文段。

发送RST报文段情况

RST复位报文段出现的原因很多,在网路编程中,也很难排查原因在哪?所以列出一些常见的原因,分享给大家:

  • 端口未打开:如果服务器程序端口位打开,而客户端来进行连接。
  • 请求超时:例如一个客户端连接服务器时,Connect系统调用返回时失败,出现错误信息,但是这个时候使用ping命令进行测试没有出现丢包现象,如果在使用抓包工具查看,客户端收到服务器端的同步报文段之后,发送了RST复位报文段,这就有可能是请求超时的原因
  • 提前关闭:如果服务端关闭或者异常终止连接,而且由于网络故障原因,对方没有接收到结束报文段没这个时候客户端还维护着原来的连接,这个时候我们把服务器重新启动,但是次服务器已经没有任何该连接的信息了。如果此时客户端向服务器写一个数据,对方就会回应一个RST复位报文段
  • 在一个已关闭的Socket上收到数据:这种情况看见的不多,比如说连接关闭后,网络中游离的数据包到达目标段,此时目标段发现这个连接已经关闭,复位报文段就会发送到另一个连接。
  • 异常终止一个连接:在数据交换完成之后,发送数据报文段。
  • 向处于LISTEN状态的端口发送数据:会收到对端发送的RST复位报文段

了解以上内容有助于网络编程的调试。

TCP可靠传输机制

TCP超时重传

如果网络异常救出出现超时或者丢包,TCP模块必须能够重传在超时时间内对方未收到的TCP报文段。

  • TCP模块为每个TCP报文段维护一个重传定时器:该定时器在TCP报文段第一次被发送时启动,如果超时时间内没收到接收方的应答,TCP模块将重传TCP报文段,并重置定时器
  • 如果超时,则进行重传,重新设置定时器

TCP拥塞控制

TCP模块的任务

  • 提高网络利用率
  • 降低丢包率
  • 拥塞控制

    其中拥塞控制,还有TCP的流量控制,这种控制机制都是为了TCP的可靠传输设置的,拥塞控制的任务是确保子网能承载所到达的流量。这是一个全局性问题,涉及到各方面的行为(刚兴趣可以自己去搜索下,这里就不做过多介绍)。

    关于拥塞控制我们进行详细的讲解:

    拥塞控制的反馈过程:

拥塞控制的最终受控变量是发送端向网络中一次连续写入的数据量,我们称为我们称为发送窗口。不过发送窗口最终以TCP报文段来发送数据,进而发送端口就限定了连续发送的TCP报文段的数量,如图所示,发送窗口被称为SWND,这些报文段的最大长度被称为MSS发送端需要合理的选择发送窗口,如果发送窗口太小,就会出现网络延迟现象,如果发送窗口过大,就容易导致网络拥塞。接收方可以通过接收通告收窗口来控制发送端的发送窗口,但是这看起来也不够,所以在发送端引入一个称为拥塞窗口的状态变量,拥塞窗口简称CWND,接收通告窗口简称RWND。图像中就显示了拥塞控制的闭环反馈控制。

###几种拥塞控制的方法:

  • TCP慢启动
  • 拥塞避免
  • 快速重传
  • 快速恢复

慢启动,拥塞避免图:

我们知道那个发送端维持一个拥塞窗口的状态变量,拥塞窗口简称CWND,拥塞窗口的大小取决于网络的拥塞程度,并且动态的变化。CWND的处理原则就是只要网络中没有出现拥塞现象,拥塞窗口就在大一些,以便把更多的分组发送出去。只要网络中出现拥塞,拥塞窗口就减少一些。以减少注入到网络分组中的数量。

我们现在来分析拥塞控制的算法:

  • 慢启动:当主机开始发送数据时,如果把大量的字节注入到网络,那么就有可能引起网络拥塞。因为我们现在并不清楚网络的负载情况。所以比较好的方法就是自动去探测一下,由小到大满满增大拥塞窗口的数值,通常在刚刚开始发送报文段的时候,先把拥塞端口设置为一个最大报文段,而在每个在收到新的报文段的时候,把拥塞窗口的大小加1,按照指数规律增长,也就是增大一个最大报文段的数值。我们用同样的方法逐渐增大发送端的拥塞窗口。可以使分组注入到网络中的数据更加合理。

    对应到图示中,横坐标从0->3都是满启动的状态。我们为了防止因为增大造成的网络拥塞,我们还需要设置一个满启动的ssthresh值,关于慢启动的ssthresh用法就是如果拥塞窗口小于ssthresh值,就应用慢启动算法。如果拥塞窗口大于ssthresh值,就停止应用慢启动算法。而改用拥塞避免算法

  • 拥塞避免:拥塞避免算法为了让拥塞窗口缓慢的增长,就是每经过一个往返的时间,就把发送方的拥塞窗口加1,而不是成倍增长,这样拥塞窗口是按照线性规律缓慢增长。对应到图像中就是那个明显的拐点以后,都是拥塞避免的算法执行。

仅仅应用 慢启动和拥塞控制,不可能达到控制网络拥塞

接下来介绍快速重传,快速恢复

在很多情况下,TCP发送端都可以接受到重复的确认报文段,例如TCP报文段缺失等等,发送端如果连接接收到三个重复的确认报文段,就可以判断网络中发生了拥塞。这个时候使用快速重传,快速恢复算法。快速重传算法我先要求接受端每收到一个失去的报文到,就立即发送重传确认。

拥塞发生或有三个处理不步骤:

拥塞发生后的处理过程:

  • 收到三个重复的确认处理过程:当收到三个重复的报文段时,重新计算满启动的ssthresh值,就是将ssthresh值减半,然后立即重传重传报文段。
  • 收到1个重复确认处理过程:将慢启动的ssthresh值减半后,开始执行拥塞避免算法,而不是刚刚提到的慢启动算法。
  • 收到新数据后的处理过程:重新设置慢启动的ssthresh值,使得拥塞窗口等于当前设置的ssthresh值。

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-10-14 00:06:07

TCP协议的那些事(总结篇)的相关文章

TCP协议详解(理论篇)

TCP协议详解(理论篇) 1.    与UDP不同的是,TCP提供了一种面向连接的.可靠的字节流服务.面向连接比较好理解,就是连接双方在通信前需要预先建立一条连接,这犹如实际生活中的打电话.助于可靠性,TCP协议中涉及了诸多规则来保障通信链路的可靠性,总结起来,主要有以下几点: (1)应用数据分割成TCP认为最适合发送的数据块.这部分是通过"MSS"(最大数据包长度)选项来控制的,通常这种机制也被称为一种协商机制,MSS规定了TCP传往另一端的最大数据块的长度.值得注意的是,MSS只能

(转)TCP协议那些事

(上) TCP是一个巨复杂的协议,因为他要解决很多问题,而这些问题又带出了很多子问题和阴暗面.所以学习TCP本身是个比较痛苦的过程,但对于学习的过程却能让人有很多收获.关于TCP这个协议的细节,我还是推荐你去看W.Richard Stevens的<TCP/IP 详解 卷1:协议>(当然,你也可以去读一下RFC793以及后面N多的RFC).另外,本文我会使用英文术语,这样方便你通过这些英文关键词来查找相关的技术文档. 之所以想写这篇文章,目的有三个, 一个是想锻炼一下自己是否可以用简单的篇幅把这

tcp协议分析

tcp协议解析 TCP在网络OSI的七层模型中的第四层--Transport层,IP在第三层--Network层,ARP在第二层--Data Link层.在第二层上的数据,我们叫Frame,在第三层上的数据叫Packet,第四层的数据叫Segment. 我们程序的数据首先会打到TCP的Segment中,然后TCP的Segment会打到IP的Packet中,然后再打到以太网Ethernet的Frame中,传到对端后,各个层解析自己的协议,然后把数据交给更高层的协议处理 TCP头格式 TCP数据段格

TCP协议疑难杂症全景解析

说明: 1).本文以TCP的发展历程解析容易引起混淆,误会的方方面面2).本文不会贴大量的源码,大多数是以文字形式描述,我相信文字看起来是要比代码更轻松的3).针对对象:对TCP已经有了全面了解的人.因为本文不会解析TCP头里面的每一个字段或者3次握手的细节,也不会解释慢启动和快速重传的定义4).除了<TCP/IP详解>(卷一,卷二)以及<Unix网络编程>以及Linux源代码之外,学习网络更好的资源是RFC 5).本文给出一个提纲,如果想了解细节,请直接查阅RFC 6).翻来覆去

TCP协议要点和难点全解

说明: 1).本文以TCP的发展历程解析容易引起混淆,误会的方方面面 2).本文不会贴大量的源码,大多数是以文字形式描述,我相信文字看起来是要比代码更轻松的 3).针对对象:对TCP已经有了全面了解的人.因为本文不会解析TCP头里面的每一个字段或者3次握手的细节,也不会解释慢启动和快速重传的定义 4).除了<TCP/IP详解>(卷一,卷二)以及<Unix网络编程>以及Linux源代码之外,学习网络更好的资源是RFC 5).本文给出一个提纲,如果想了解细节,请直接查阅RFC 6).翻

TCP协议疑难杂症全景分析

说明: 1).本文以TCP的发展历程解析容易引起混淆,误会的方方面面 2).本文不会贴大量的源码,大多数是以文字形式描述,我相信文字看起来是要比代码更轻松的 3).针对对象:对TCP已经有了全面了解的人.因为本文不会解析TCP头里面的每一个字段或者3次握手的细节,也不会解释慢启动和快速重传的定义 4).除了<TCP/IP详解>(卷一,卷二)以及<Unix网络编程>以及Linux源代码之外,学习网络更好的资源是RFC 5).本文给出一个提纲,如果想了解细节,请直接查阅RFC 6).翻

【转载】TCP协议疑难杂症全景解析

说明: 1).本文以TCP的发展历程解析容易引起混淆,误会的方方面面2).本文不会贴大量的源码,大多数是以文字形式描述,我相信文字看起来是要比代码更轻松的3).针对对象:对TCP已经有了全面了解的人.因为本文不会解析TCP头里面的每一个字段或者3次握手的细节,也不会解释慢启动和快速重传的定义4).除了<TCP/IP详解>(卷一,卷二)以及<Unix网络编程>以及Linux源代码之外,学习网络更好的资源是RFC 5).本文给出一个提纲,如果想了解细节,请直接查阅RFC 6).翻来覆去

在网络7层协议中,如果想使用UDP协议达到TCP协议的效果,可以在哪层做文章?(QQ 为什么采用 UDP 协议,而不采用 TCP 协议实现?)

为了解决这题,可以具体看看下面这个讨论. 解灵运工程师 185 人赞同 某次架构师大会上那个58同城做即时通信的人说:原因是因为当时没有epoll这种可以支持成千上万tcp并发连接的技术,所以他们使用了udp,然后在udp上面封装了一下,模拟了一下tcp,解决了大并发的问题,之后因为做的很nb了,虽然epoll这种技术出现了,还是没有改回使用tcp了.现在再做类似的东西就不需要使用udp了.这个说法应该比较可信的. 发布于 2014-04-16 18 条评论 感谢 分享 收藏 • 没有帮助 • 

TCP协议简介及其三次握手与四次挥手

本篇博文是对参考文章的学习总结 一.TCP介绍 tcp协议之所以设计复杂,可以说它秉承的是“性恶论”.它认为网络环境天生就是恶劣的,丢包.乱序.重传.拥塞都是常有的事,一言不合就可能送达不了,所以只能从算法层面上来保证传输的可靠性. TCP包头格式 其中源端口号和目的端口号是用来确定数据应该发往哪个应用层中的进程. 序号是用来解决乱序的问题. 确认序号用来确认发出去的包对方是否接收成功,不管有没有成功都应该有个回复,可以解决丢包问题,如果对方没有接收成功,则继续发送.TCP 是靠谱的协议,但是这