TCP 协议详解

TCP 协议详解

  1. 为什么会有TCP/IP协议

    1
    2
    3
    4
    5
    6
    7
    在世界上各地,各种各样的电脑运行着各自不同的操作系统为人提供服务,这些电脑在表达同一种信息的时候所使用的方法是千差万别.计算机使用者意识到,计算机只是单兵作战并不会发挥太大的作用,只有把它们联合起来,电脑才会发挥出它最大的潜力.于是人们就想方设法的用电线把电脑连接到了一起.但简单的连到一起是远远不够的,就好像语言不同的两个人互相见了面,完全不能交流信息.因此他们需要定义一些共通的东西来进行交流,TCP/IP就是为此而生

    TCP/IP不是一个协议,而是一个协议族的统称.里面包含的协议:
    应用层: TFTP,HTTP,SNMP,FTP,SMTP,DNS,Telnet等等
    传输层: TCP,UDP
    网络层: IP,ICMP,OSPF,EIGRP,IGMP
    数据链路层: SLIP,CSLIP,PPP,MTU
  2. TCP/IP协议分层
    TCP/IP协议分层

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    TCP/IP协议族按照层次由上到下,层层包装:
    * 应用层
    向用户提供一组常用的应用程序,比如: 电子邮件,文件传输访问,远程登录等
    * 传输层
    提供应用程序间的通信.其功能包括:
    1.格式化信息流
    2.提供可靠传输
    为实现后者,传输层协议规定接收端必须发回确认,并且假如分组丢失,必须重新发送
    * 网络层
    负责相邻计算机之间的通信.其功能包括三方面:
    1.处理来自传输层的分组发送请求,收到请求后,将分组装入IP数据报,填充报头,选择去往信宿机的路径,然后将数据报发往适当的网络接口
    2.处理输入数据报,首先检查其合法性,然后进行寻径
    假如该数据报已到达信宿机,则去掉报头,将剩下部分交给适当的传输协议
    假如该数据报尚未到达信宿,则转发该数据报
    3.处理路径,流控,拥塞等问题
    * 网络接口层
    这是TCP/IP软件的最低层,负责接收IP数据报并通过网络发送之,或者从网络上接收物理帧,抽出IP数据报,交给IP层
  3. IP是无连接的

    1
    2
    3
    4
    5
    IP用于计算机之间的通信

    IP是无连接的通信协议.它不会占用两个正在通信的计算机之间的通信线路.这样,IP就降低了对网络线路的需求.每条线可以同时满足许多不同的计算机之间的通信需要.通过IP,消息(或者其他数据)被分割为小的独立的包,并通过因特网在计算机之间传送

    IP负责将每个包路由至它的目的地
  4. IP地址

    1
    2
    3
    4
    5
    6
    7
    8
    每个计算机必须有一个IP地址才能够连入因特网.每个IP包必须有一个地址才能够发送到另一台计算机

    网络上每一个节点都必须有一个独立的Internet地址(也叫做IP地址).现在,通常使用的IP地址是一个32bit的数字,也就是我们常说的IPv4标准,这32bit的数字分成四组,也就是常见的255.255.255.255的样式.IPv4标准上,地址被分为五类,我们常用的是B类地址.需要注意的是IP地址是"网络号+主机号"的组合,这非常重要

    TCP/IP使用32个比特来编址.一个计算机字节是8比特.所以TCP/IP使用了4个字节
    一个计算机字节可以包含256个不同的值:
    00000000,00000001,00000010,00000011,00000100......11111111
    现在,你知道了为什么TCP/IP地址是介于0到255之间的4个数字
  5. TCP 使用固定的连接

    1
    2
    3
    4
    5
    6
    7
    TCP用于应用程序之间的通信

    当应用程序希望通过TCP与另一个应用程序通信时,它会发送一个通信请求.这个请求必须被送到一个确切的地址.在双方"握手"之后,TCP将在两个应用程序之间建立一个全双工(full-duplex)的通信

    这个全双工的通信将占用两个计算机之间的通信线路,直到它被一方或双方关闭为止

    UDP和TCP很相似,但是更简单,同时可靠性低于TCP
  6. IP 路由器

    1
    2
    3
    当一个IP包从一台计算机被发送,它会到达一个IP路由器
    IP路由器负责将这个包路由至它的目的地,直接地或者通过其他的路由器.
    在一个相同的通信中,一个包所经由的路径可能会和其他的包不同.而路由器负责根据通信量,网络中的错误或者其他参数来进行正确地寻址
  7. 域名

    1
    2
    3
    4
    5
    12个阿拉伯数字很难记忆.使用一个名称更容易.
    用于TCP/IP地址的名字被称为域名.例如: www.baidu.com

    当你在浏览器输入"http://www.baidu.com",并按下回车键后,域名会被一种DNS程序翻译为IP地址
    在全世界,数量庞大的DNS服务器被连入因特网.DNS服务器负责将域名翻译为TCP/IP地址,同时负责使用新的域名信息更新彼此的系统.当一个新的域名连同其TCP/IP地址一同注册后,全世界的DNS服务器都会对此信息进行更新
  8. TCP/IP

    1
    2
    3
    TCP/IP 意味着TCP和IP在一起协同工作
    TCP负责应用软件和网络软件之间的通信;IP负责计算机之间的通信
    TCP负责将数据分割并装入IP包,然后在它们到达的时候重新组合它们;IP负责将包发送至接受者
  9. TCP报文格式
    TCP报文格式

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    * 16位源端口号 和 16位目标端口号
    16位的源端口占用2个字节(1个字节占用8位)
    端口是传输层与应用层的服务接口,传输层的复用和分用功能都需要通过端口才能实现

    * 32位序列号
    32位序列号占用四个字节
    TCP连接中传送的数据流中,当SYN出现,序列码实际上是初始序列码(Initial Sequence Number,ISN),而第一个数据字节是ISN+1.这个序列号(序列码)可用来补偿传输中的不一致

    * 32位确认序号
    32位确认序号占用四个字节
    32位的序列号是期望收到对方的下一个报文段的数据的第一个字节的序号,
    如果设置了ACK控制位,这个值表示一个准备接收的包的序列码

    * 4位数据偏移(首部长度)
    4位数据偏移(首部长度)占用1个字节
    4位包括TCP头大小,指示何处数据开始

    * 6位保留
    6位保留为了将来定义新的用途而保留,目前设置为0

    * 标志
    6位标志域:
    URG 紧急标志,当URG=1时,表明紧急指针字段有效.它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)
    ACK 有意义的应答标志,只有当ACK=1时确认号字段才有效,当ACK=0时,确认号无效
    PSH 推,TCP接收到PSH=1的报文段,就尽快地交付接收应用进程,而不再等到整个缓存都填满了后再向上交付
    RST 重置连接标志,当RST=1时,表明TCP连接中出现严重差错,必须释放连接,然后再重新建立运输连接
    SYN 同步序列号标志,当SYN=1表示这是一个连接请求或连接接受报文
    FIN 完成发送数据标志,当FIN=1表明此报文段的发送端的数据已发送完毕,并要求释放连接

    * 16位窗口大小
    用来表示想收到的每个TCP数据段的大小.TCP的流量控制由连接的每一端通过声明的窗口大小来提供.窗口大小为字节数,起始于确认序号字段指明的值,这个值是接收端正期望接收的字节.窗口大小是一个16字节字段,因而窗口大小最大为65535字节

    * 16位校验和
    16位TCP头.源机器基于数据内容计算一个数值,收信息机要与源机器数值结果完全一样,从而证明数据的有效性.检验和覆盖了整个的TCP报文段:这是一个强制性的字段,一定是由发送端计算和存储,并由接收端进行验证的

    * 16位紧急指针
    指向后面是优先数据的字节,在URG标志设置了时才有效
    如果URG标志没有被设置,紧急域作为填充.加快处理标示为紧急的数据段

    * 选项
    长度不定,但长度必须为1个字节.如果没有选项就表示这个1字节的域等于0

    * 数据
    该TCP协议包负载的数据

    六位标志域的各个选项功能如下:
    URG: 紧急标志.紧急标志为"1"表明该位有效
    ACK: 确认标志.表明确认编号栏有效.大多数情况下该标志位是置位的.TCP报头内的确认编号栏内包含的确认编号(w+1)为下一个预期的序列编号,同时提示远端系统已经成功接收所有数据
    PSH: 推标志.该标志置位时,接收端不将该数据进行队列处理,而是尽可能快地将数据转由应用处理.在处理Telnet或rlogin等交互模式的连接时,该标志总是置位的
    RST: 复位标志.用于复位相应的TCP连接
    SYN: 同步标志.表明同步序列编号栏有效.该标志仅在三次握手建立TCP连接时有效.它提示TCP连接的服务端检查序列编号,该序列编号为TCP连接初始端的初始序列编号.在这里,可以把TCP序列编号看作是一个范围从0到4,294,967,295的32位计数器.通过TCP连接交换的数据中每一个字节都经过序列编号.在TCP报头中的序列编号栏包括了TCP分段中第一个字节的序列编号
    FIN: 结束标志
  10. TCP三次握手
    TCP三次握手

    1
    2
    3
    4
    5
    6
    第一次握手: Client将标志位SYN置为1,随机产生一个值seq=J,并将该数据包发送给Server,Client进入SYN_SENT状态,等待Server确认
    第二次握手: Server收到数据包后,由标志位SYN=1知道Client请求建立连接,Server将标志位ACK设置为1,ack设置为J+1,将标志位SYN设置为1,并随机产生一个值seq=K,Server将该数据包发送给Client以确认连接请求,Server进入SYN_RCVD状态
    第三次握手: Client收到确认后,检查ack是否为J+1,ACK是否为1.如果正确则将标志位ACK置为1,ack=K+1,并将该数据包发送给Server.Server检查ack是否为K+1,ACK是否为1,如果正确则连接建立成功.Client和Server进入ESTABLISHED状态,完成三次握手,随后Client与Server之间可以开始传输数据了

    SYN攻击:
    在三次握手过程中,Server发送SYN-ACK之后,收到Client的ACK之前的TCP连接称为半连接(half-open connect),此时Server处于SYN_RCVD状态,当收到ACK后,Server转入ESTABLISHED状态.SYN攻击就是Client在短时间内伪造大量不存在的IP地址,并向Server不断地发送SYN包,Server回复确认包,并等待Client的确认,由于源地址是不存在的,因此Server需要不断重发直至超时,这些伪造的SYN包将长时间占用未连接队列,导致正常的SYN请求因为队列满而被丢弃,从而引起网络堵塞甚至系统瘫痪.SYN攻击时一种典型的DDOS攻击,检测SYN攻击的方式非常简单,即当Server上有大量半连接状态且源IP地址是随机的,则可以断定遭到SYN攻击了,使用如下命令可以让之现行: netstat -nap | grep SYN_RECV
  11. TCP四次挥手
    TCP报文格式

    1
    2
    3
    4
    5
    6
    7
    8
    四次挥手(Four-Way Wavehand),即终止TCP连接,就是指断开一个TCP连接时,需要客户端和服务端总共发送4个包以确认连接的断开.在socket编程中,这一过程由客户端或服务端任一方执行close来触发.

    由于TCP连接时全双工的,因此每个方向都必须要单独进行关闭.这一原则是当一方完成数据发送任务后,发送一个FIN来终止这一方向的连接,收到一个FIN只是意味着这一方向上没有数据流动了,即不会再收到数据了.但是在这个TCP连接上仍然能够发送数据,直到这一方向也发送了FIN.首先进行关闭的一方将执行主动关闭,而另一方则执行被动关闭.

    第一次挥手: Client发送一个"FIN M",用来关闭Client到Server的数据传送,Client进入FIN_WAIT_1状态
    第二次挥手: Server收到"FIN M"后,发送一个"ACK=1,ack=M+1"给Client,确认序号为"M+1",Server进入CLOSE_WAIT状态,client进入FIN_WAIT_2状态
    第三次挥手: Server发送一个"FIN N",用来关闭Server到Client的数据传送,Server进入LAST_ACK状态
    第四次挥手: Client收到"FIN N"后,Client进入TIME_WAIT状态,接着发送一个"ACK=1,ack=N+1"给Server,确认序号为"N+1",Server进入CLOSED状态,完成四次挥手
  12. TCP 三次握手 和 四次挥手问题

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    问题一: 为什么建立连接是三次握手,而关闭连接却是四次挥手呢?
    解答:
    这是因为服务端在LISTEN状态下,收到建立连接请求的SYN报文后,把ACK和SYN放在一个报文里发送给客户端.而关闭连接时,当收到对方的FIN报文时,仅仅表示对方不再发送数据了但是还能接收数据,己方也未必全部数据都发送给对方了,所以己方可以立即close,也可以发送一些数据给对方后,再发送FIN报文给对方来表示同意现在关闭连接,因此,己方ACK和FIN一般都会分开发送

    问题二: 为什么TIME_WAIT状态需要经过2MSL(最大报文段生存时间)才能返回到CLOSE状态?
    解答:
    原因一: 保证TCP协议的全双工连接能够可靠关闭
    原因二: 保证这次连接的重复数据段从网络中消失

    先说原因一,如果Client直接CLOSED了,那么由于IP协议的不可靠性或者是其它网络原因,导致Server没有收到Client最后回复的ACK.那么Server就会在超时之后继续发送FIN,此时由于Client已经CLOSED了,就找不到与重发的FIN对应的连接,最后Server就会收到RST而不是ACK,Server就会以为是连接错误把问题报告给高层.这样的情况虽然不会造成数据丢失,但是却导致TCP协议不符合可靠连接的要求.所以,Client不是直接进入CLOSED,而是要保持TIME_WAIT,当再次收到FIN的时候,能够保证对方收到ACK,最后正确的关闭连接

    再说原因二,如果Client直接CLOSED,然后又再向Server发起一个新连接,我们不能保证这个新连接与刚关闭的连接的端口号是不同的.也就是说有可能新连接和老连接的端口号是相同的.一般来说不会发生什么问题,但是还是有特殊情况出现:假设新连接和已经关闭的老连接端口号是一样的,如果前一次连接的某些数据仍然滞留在网络中,这些延迟数据在建立新连接之后才到达Server,由于新连接和老连接的端口号是一样的,又因为TCP协议判断不同连接的依据是socket pair,于是,TCP协议就认为那个延迟的数据是属于新连接的,这样就和真正的新连接的数据包发生混淆了.所以TCP连接还要在TIME_WAIT状态等待2倍MSL,这样可以保证本次连接的所有数据都从网络中消失