图解 | 你管这破玩意儿叫TCP？ - JOYK Joy of Geek, Geek News, Link all geek

你是一台电脑，你的名字叫 A

u6nayqn.png!mobile

经过《如果让你来设计网络》这篇文章中的一番折腾，只要你知道另一位伙伴 B 的 IP 地址，且你们之间的网络是通的，无论多远，你都可以将一个数据包发送给你的伙伴 B

6VJzEzm.png!mobile

这就是物理层、数据链路层、网络层这三层所做的事情。

站在第四层的你，就可以不要脸地利用下三层所做的铺垫，随心所欲地发送数据，而不必担心找不到对方了。

riEv2aQ.gif!mobile

虽然你此时还什么都没干，但你还是给自己这一层起了个响亮的名字，叫做 传输层 。

你本以为自己所在的第四层万事大吉，啥事没有，但很快问题就接踵而至。

问题来了

前三层协议只能把数据包从一个主机搬到另外一台主机，但是，到了目的地以后，数据包具体交给哪个程序（进程）呢？

RBza6n7.png!mobile

所以，你需要把通信的进程区分开来，于是就给每个进程分配一个数字编号，你给它起了一个响亮的名字： 端口号 。

v6ZFziN.png!mobile

然后你在要发送的数据包上，增加了传输层的头部， 源端口号 与 目标端口号 。

emuiMn2.png!mobile

OK，这样你将原本主机到主机的通信，升级为了 进程和进程之间的通信 。

你没有意识到，你不知不觉实现了 UDP 协议 ！

（当然 UDP 协议中不光有源端口和目标端口，还有数据包长度和校验值，我们暂且略过）

就这样，你用 UDP 协议无忧无虑地同 B 进行着通信，一直没发生什么问题。

QRFVfyE.gif!mobile

但很快，你发现事情变得非常复杂…

丢包问题

由于网络的不可靠，数据包可能在半路丢失，而 A 和 B 却无法察觉。

MBN32ui.gif!mobile

对于丢包问题，只要解决两个事就好了。

第一个，A 怎么知道包丢了？

答案：让 B 告诉 A

第二个，丢了的包怎么办？

答案：重传

于是你设计了如下方案，A 每发一个包，都必须收到来自 B 的确认（ACK），再发下一个，否则在一定时间内没有收到确认，就重传这个包。

eYRRJr2.gif!mobile

你管它叫 停止等待协议 。只要按照这个协议来，虽然 A 无法保证 B 一定能收到包，但 A 能够确认 B 是否收到了包，收不到就重试，尽最大努力让这个通信过程变得可靠，于是你们现在的通信过程又有了一个新的特征， 可靠交付 。

效率问题

停止等待虽然能解决问题，但是效率太低了，A 原本可以在发完第一个数据包之后立刻开始发第二个数据包，但由于停止等待协议，A 必须等数据包到达了 B ，且 B 的 ACK 包又回到了 A，才可以继续发第二个数据包，这效率慢得可不是一点两点。

于是你对这个过程进行了改进，采用 流水线 的方式，不再傻傻地等。

RfYJBnb.gif!mobile

顺序问题

但是网路是复杂的、不可靠的。

有的时候 A 发出去的数据包，分别走了不同的路由到达 B，可能无法保证和发送数据包时一样的顺序。

rAVNJrA.gif!mobile

在流水线中有多个数据包和ACK包在 乱序流动 ，他们之间对应关系就乱掉了。

难道还回到停止等待协议？A 每收到一个包的确认（ACK）再发下一个包，那就根本不存在顺序问题。应该有更好的办法！

A 在发送的数据包中增加一个序号（seq），同时 B 要在 ACK 包上增加一个 确认号 （ack），这样不但解决了停止等待协议的效率问题，也通过这样标序号的方式解决了顺序问题。

JfAVJbR.gif!mobile

而 B 这个确认号意味深长：比如 B 发了一个确认号为 ack = 3，它不仅仅表示 A 发送的序号为 2 的包收到了，还表示 2 之前的数据包都收到了。这种方式叫 累计确认 或 累计应答 。

IBnUBnB.gif!mobile

注意，实际上 ack 的号是收到的最后一个数据包的序号 seq + 1，也就是告诉对方下一个应该发的序号是多少。但图中为了便于理解，ack 就表示收到的那个序号，不必纠结。

流量问题

有的时候，A 发送数据包的速度太快，而 B 的接收能力不够，但 B 却没有告知 A 这个情况。

QrqYFbB.gif!mobile

怎么解决呢？

很简单，B 告诉 A 自己的接收能力，A 根据 B 的接收能力，相应控制自己的 发送速率 ，就好了。

B 怎么告诉 A 呢？B 跟 A 说"我很强"这三个字么？那肯定不行，得有一个严谨的规范。

于是 B 决定，每次发送数据包给 A 时，顺带传过来一个值，叫 窗口大小 （win)，这个值就表示 B 的 接收能力 。同理，每次 A 给 B 发包时也带上自己的窗口大小，表示 A 的接收能力。

NZrQzm6.gif!mobile

B 告诉了 A 自己的窗口大小值，A 怎么利用它去做 A 这边发包的流量控制呢？

很简单，假如 B 给 A 传过来的窗口大小 win = 5，那 A 根据这个值，把自己要发送的数据分成这么几类。

QJn63aJ.png!mobile

图片过于清晰，就不再文字解释了。

当 A 不断发送数据包时， 已发送的最后一个序号 就往右移动，直到碰到了窗口的上边界，此时 A 就无法继续发包，达到了流量控制。

6rmaa2y.gif!mobile

但是当 A 不断发包的同时，A 也会收到来自 B 的确认包，此时 整个窗口 会往右移动，因此上边界也往右移动，A 就能发更多的数据包了。

ZvuIz2Q.gif!mobile

以上都是在窗口大小不变的情况下，而 B 在发给 A 的 ACK 包中，每一个都可以 重新设置 一个新的窗口大小，如果 A 收到了一个新的窗口大小值，A 会随之调整。

如果 A 收到了比原窗口值更大的窗口大小，比如 win = 6，则 A 会直接将窗口上边界向右移动 1 个单位。

3uuUniA.gif!mobile

如果 A 收到了比原窗口值小的窗口大小，比如 win = 4，则 A 暂时不会改变窗口大小，更不会将窗口上边界向左移动，而是等着 ACK 的到来，不断将左边界向右移动，直到窗口大小值收缩到新大小为止。

3aMvmqI.gif!mobile

OK，终于将流量控制问题解决得差不多了，你看着上面一个个小动图，给这个窗口起了一个更生动的名字， 滑动窗口 。

拥塞问题

但有的时候，不是 B 的接受能力不够，而是网络不太好，造成了 网络拥塞 。

BnABFb.gif!mobile

拥塞控制与流量控制有些像，但流量控制是受 B 的接收能力影响，而拥塞控制是受 网络环境 的影响。

拥塞控制的解决办法依然是通过设置一定的窗口大小，只不过，流量控制的窗口大小是 B 直接告诉 A 的，而拥塞控制的窗口大小按理说就应该是网络环境主动告诉 A。

但网络环境怎么可能主动告诉 A 呢？只能 A 单方面通过试探，不断感知网络环境的好坏，进而确定自己的拥塞窗口的大小。

VzaYBny.gif!mobile

拥塞窗口大小的计算有很多复杂的算法，就不在本文中展开了，假如 拥塞窗口的大小为 cwnd ，上一部分流量控制的 滑动窗口的大小为 rwnd ，那么窗口的右边界受这两个值共同的影响，需要取它俩的最小值。

窗口大小 = min(cwnd, rwnd)

含义很容易理解，当 B 的接受能力比较差时，即使网络非常通畅，A 也需要根据 B 的接收能力限制自己的发送窗口。当网络环境比较差时，即使 B 有很强的接收能力，A 也要根据网络的拥塞情况来限制自己的发送窗口。正所谓受其短板的影响嘛~

连接问题

有的时候，B 主机的相应进程还没有准备好或是挂掉了，A 就开始发送数据包，导致了浪费。

MNfaimf.gif!mobile

这个问题在于，A 在跟 B 通信之前，没有事先确认 B 是否已经准备好，就开始发了一连串的信息。就好比你和另一个人打电话，你还没有"喂"一下确认对方有没有在听，你就巴拉巴拉说了一堆。

这个问题该怎么解决呢？

地球人都知道， 三次握手 嘛！

A：我准备好了(SYN)

B：我知道了(ACK)，我也准备好了(SYN)

A：我知道了(ACK)

n2yInyz.gif!mobile

A 与 B 各自在内存中维护着自己的状态变量，三次握手之后，双方的状态都变成了 连接已建立 （ESTABLISHED）。

虽然就只是发了三次数据包，并且在各自的内存中维护了状态变量，但这么说总觉得太 low，你看这个过程相当于双方建立连接的过程，于是你灵机一动，就叫它 面向连接 吧。

注意：这个连接是虚拟的，是由 A 和 B 这两个终端共同维护的，在网络中的设备根本就不知道连接这回事儿！

但凡事有始就有终，有了建立连接的过程，就要考虑释放连接的过程，又是地球人都知道， 四次挥手 嘛！

A：再见，我要关闭了(FIN)

B：我知道了(ACK)

给 B 一段时间把自己的事情处理完…

B：再见，我要关闭了(FIN)

A：我知道了(ACK)

UfiAnye.gif!mobile

总结

以上讲述的，就是 TCP 协议的核心思想，上面过程中需要传输的信息，就体现在 TCP 协议的头部，这里放上最常见的 TCP 协议头解读的图。

zeiYnar.png!mobile

不知道你现在再看下面这句话，是否能理解：

TCP 是面向连接的、可靠的、基于字节流的传输层通信协议

面向连接、可靠，这两个词通过上面的讲述很容易理解，那什么叫做基于字节流呢？

很简单，TCP 在建立连接时，需要告诉对方 MSS（最大报文段大小）。

也就是说，如果要发送的数据很大，在 TCP 层是需要按照 MSS 来切割成一个个的 TCP 报文段 的。

切割的时候我才不管你原来的数据表示什么意思，需要在哪里断句啥的，我就把它当成一串毫无意义的字节，在我想要切割的地方咔嚓就来一刀，标上序号，只要接收方再根据这个序号拼成最终想要的完整数据就行了。

在我 TCP 传输这里，我就把它当做一个个的字节，也就是基于字节流的含义了。

qURbInM.jpg!mobile

最后留给大家一个作业，模拟 A 与 B 建立一个 TCP 连接。

第一题：A 给 B 发送 “aaa” ，然后 B 给 A 回复一个简单的字符串 “success”，并将此过程抓包。

第二题：A 给 B 发送 “aaaaaa … a” 超过最大报文段大小，然后 B 给 A 回复一个简单的字符串 “success”，并将此过程抓包。

下面是我抓的包（第二题）

三次握手阶段

A -> B [SYN] Seq=0 Win=64240 Len=0

MSS=1460 WS=256

B - >A [SYN, ACK] Seq=0 Ack=1 Win=29200 Len=0

MSS=1424 WS=512

A -> B [ACK] Seq=1 Ack=1 Win=132352 Len=0

数据发送阶段

A -> B [ACK] Seq=1 Ack=1 Win=132352 Len=1424

A -> B [ACK] Seq=1425 Ack=1 Win=132352 Len=1424

A -> B [PSH, ACK] Seq=2849 Ack=1 Win=132352 Len=1247

B -> A [ACK] Seq=1 Ack=1425 Win=32256 Len=0

B -> A [ACK] Seq=1 Ack=2849 Win=35328 Len=0

B -> A [ACK] Seq=1 Ack=4096 Win=37888 Len=0

B -> A [PSH, ACK] Seq=1 Ack=4096 Win=37888 Len=7

四次挥手阶段

B -> A [FIN, ACK] Seq=8 Ack=4096 Win=37888 Len=0

A -> B [ACK] Seq=4096 Ack=9 Win=132352 Len=0

A -> B [FIN, ACK] Seq=4096 Ack=9 Win=132352 Len=0

图解 | 你管这破玩意儿叫TCP？

你是一台电脑，你的名字叫 A

问题来了

丢包问题

第一个，A 怎么知道包丢了？

第二个，丢了的包怎么办？

效率问题

顺序问题

流量问题

拥塞问题

窗口大小 = min(cwnd, rwnd)

连接问题

总结

TCP 是面向连接的、可靠的、基于字节流的传输层通信协议

三次握手阶段

数据发送阶段

四次挥手阶段

Recommend

在.NET Core 中实现健康检查

递归特征金字塔+可切换空洞卷积提升目标检测性能（附框架源码）

SourceGenerator入门指北

天猫、名创优品都在做的小样生意，真的有“钱”景吗？

java进阶(33)--IO流

异构计算时代正式起飞

国产剧走向大通胀时代

如何在 ASP.Net Core 使用内存缓存

火花思维完成E轮超4亿美元融资，投后估值15亿美元？回应：不评论

Spark 3.0 已来，是时候 on kubernetes 了

About Joyk