TCP与socket区别
网络中进程之间如何通信?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17进程通信的概念最初来源于单机系统.
由于每个进程都在自己的地址范围内运行,为保证两个相互通信的进程之间既互不干扰又协调一致工作,
操作系统为进程通信提供了相应设施,如:
* UNIX BSD有: 管道(pipe),命名管道(named pipe),软中断信号(signal)
* UNIX system V有: 消息(message),共享存储区(shared memory)和信号量(semaphore)等
注意,他们都仅限于用在本机进程之间通信!
网络间进程通信要解决的是不同主机进程间的相互通信问题:
首先,要解决网络间进程标识问题.同一主机上,不同进程可用进程号唯一标识;不同主机上,各自独立分配的进程号不能唯一标识该进程
其次,要解决网络进程间多重协议的识别问题.操作系统支持的网络协议众多,不同协议的工作方式不同,地址格式也不同
以上两个问题,TCP/IP协议族已经帮我们解决了:
网络层的"ip地址"可以唯一标识网络中的主机;传输层的"协议+端口"可以唯一标识主机中的应用程序(进程)
这样利用三元组(ip地址,协议,端口)就可以标识网络进程了,网络中的进程通信就可以利用这个标志与其它进程进行交互
使用TCP/IP协议的应用程序通常采用应用编程接口 "UNIX BSD的套接字(socket)" 和 "UNIX System V的TLI(已被淘汰)" 来实现网络进程之间的通信.就目前而言,几乎所有的应用程序都是采用socket,而现在又是网络时代,网络中进程通信是无处不在,这就是我为什么说"一切皆socket"Socket在TCP/IP模型中的位置
1
2
3
4TCP/IP协议存在于系统中,网络服务通过系统提供,在系统中增加支持TCP/IP的系统调用---Berkeley套接字,如:Socket,Connect,Send,Recv等
TCP/IP协议族包括应用层,传输层,网络层,数据链路层,Socket是 应用层 与 TCP/IP协议族 通信的中间软件抽象层
如图:
Socket是什么?
1
2
3
4网络中的进程是通过socket来通信的,那什么是socket呢?
Socket起源于UNIX,在Unix一切皆文件哲学的思想下.Socket可以用"打开(open) –> 读写(write/read) –> 关闭(close)"模式实现.服务器和客户端各自维护一个"文件",在建立连接打开后,可以向自己文件写入内容供对方读取或者读取对方内容,通讯结束时关闭文件。
通俗讲,Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口.在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议Socket通信流
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78* socket()函数
int socket(int domain, int type, int protocol);
Socket函数对应于普通文件的打开操作.
普通文件的打开操作返回一个文件描述字,而socket()函数用于创建一个socket描述符(socket descriptor),它唯一标识一个socket.这个socket描述字跟文件描述字一样,后续的操作都有用到它,把它作为参数,通过它来进行一些读写操作.
创建socket的时候,可以指定不同的参数创建不同的socket描述符
Socket函数的三个参数分别为:
* domain,即协议域,又称为协议族(family)
常用的协议族有: AF_INET,AF_INET6,AF_LOCAL(或称AF_UNIX,Unix域socket),AF_ROUTE等等
协议族决定了socket的地址类型,在通信中必须采用对应的地址,如: AF_INET决定了要用ipv4地址(32位的)与端口号(16位的)的组合;AF_UNIX决定了要用一个绝对路径名作为地址
* type,指定socket类型
常用的socket类型有: SOCK_STREAM,SOCK_DGRAM,SOCK_RAW,SOCK_PACKET,SOCK_SEQPACKET等等
* protocol,指定协议
常用的协议有: IPPROTO_TCP,IPPTOTO_UDP,IPPROTO_SCTP,IPPROTO_TIPC等,它们分别对应TCP传输协议,UDP传输协议,STCP传输协议,TIPC传输协议
注意: 上面的type和protocol并不可以随意组合的,如: SOCK_STREAM不可以跟IPPROTO_UDP组合;当protocol为0时,会自动选择type类型对应的默认协议
当我们调用socket创建一个socket时,返回的socket描述符存在于协议族(address family,AF_XXX)空间中,但没有一个具体的地址.如果想要给它赋值一个地址,就必须调用bind()函数,否则就当调用connect(),listen()时系统会自动随机分配一个端口
* bind()函数
bind()函数把一个地址族中的特定地址赋给socket
例如,对应AF_INET,AF_INET6就是把一个ipv4或ipv6地址和端口号组合赋给socket
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
函数的三个参数分别为:
* sockfd,即socket描述字
它是通过socket()函数创建了,唯一标识一个socket.bind()函数就是将给这个描述字绑定一个名字
* addr,一个const struct sockaddr *指针,指向要绑定给sockfd的协议地址
这个地址结构根据地址创建socket时的地址协议族的不同而不同
* addrlen:对应的是地址的长度
通常服务器在启动的时候都会绑定一个众所周知的地址(如ip地址+端口号),用于提供服务,客户就可以通过它来接连服务器.而客户端就不用指定,有系统自动分配一个端口号和自身的ip地址组合.这就是为什么通常服务器端在listen之前会调用bind(),而客户端就不会调用,而是在connect()时由系统随机生成一个
* listen(),connect()函数
如果作为一个服务器,在调用socket(),bind()之后就会调用listen()来监听这个socket
如果客户端这时调用connect()发出连接请求,服务器端就会接收到这个请求
int listen(int sockfd, int backlog);
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
listen()函数的第一个参数即为要监听的socket描述字,第二个参数为相应socket可以排队的最大连接个数
socket()函数创建的socket默认是一个主动类型的,listen函数将socket变为被动类型的,等待客户的连接请求
connect()函数的第一个参数即为客户端的socket描述字,第二参数为服务器的socket地址,第三个参数为socket地址的长度.
客户端通过调用connect函数来建立与TCP服务器的连接
* accept()函数
TCP服务器端依次调用socket(),bind(),listen()之后,就会监听指定的socket地址了
TCP客户端依次调用socket(),connect()之后就向TCP服务器发送了一个连接请求,TCP服务器监听到这个请求之后,就会调用accept()函数取接收请求,这样就建立好了连接.之后就可以开始网络I/O操作了,即类同于普通文件的读写I/O操作
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
accept()函数的第一个参数为服务器的socket描述字,第二个参数为指向struct sockaddr *的指针,用于返回客户端的协议地址,第三个参数为协议地址的长度.如果accpet成功,那么其返回值是由内核自动生成的一个全新的描述字,代表与返回客户的TCP连接
注意:
accept的第一个参数为服务器的socket描述字,是服务器开始调用socket()函数生成的,称为监听socket描述字,而accept函数返回的是已连接的socket描述字.
一个服务器通常通常仅仅只创建一个监听socket描述字,它在该服务器的生命周期内一直存在.内核为每个由服务器进程接受的客户连接创建了一个已连接socket描述字,当服务器完成了对某个客户的服务,相应的已连接socket描述字就被关闭.
* read()、write()函数等
建立好连接后,可以调用网络I/O进行读写操作了,即实现了网络中不同进程之间的通信.
网络I/O操作有下面几组:
* read()/write()
* recv()/send()
* readv()/writev()
* recvmsg()/sendmsg()
* recvfrom()/sendto()
推荐使用"recvmsg()/sendmsg()"函数,这两个函数是最通用的I/O函数,实际上可以把上面的其它函数都替换成这两个函数
read()函数是负责从fd中读取内容.当读成功时,read返回实际所读的字节数,如果返回的值是0表示已经读到文件的结束了,小于0表示出现了错误.如果错误为EINTR说明读是由中断引起的,如果是ECONNREST表示网络连接出了问题.
write()函数将buf中的nbytes字节内容写入文件描述符fd.成功时返回写的字节数.失败时返回-1,并设置errno变量.在网络程序中,当我们向套接字文件描述符写时有俩种可能:一个是write的返回值大于0,表示写了部分或者是全部的数据;一个是返回的值小于0,此时出现了错误.我们要根据错误类型来处理.如果错误为EINTR表示在写的时候出现了中断错误;如果为EPIPE表示网络连接出现了问题(对方已经关闭了连接)
* close()函数
在服务器与客户端建立连接之后,会进行一些读写操作,完成了读写操作就要关闭相应的socket描述字,好比操作完打开的文件要调用fclose关闭打开的文件
int close(int fd);
close一个TCP socket的缺省行为时把该socket标记为以关闭,然后立即返回到调用进程.该描述字不能再由调用进程使用,也就是说不能再作为read或write的第一个参数.
注意: close操作只是使相应socket描述字的引用计数减1,只有当引用计数为0的时候,才会触发TCP客户端向服务器发送终止连接请求TCP三次握手之Socket
1
2
3
4
5第一次,当客户端调用connect时,触发了连接请求,向服务器发送了"SYN=1,Seq=J"包,这时connect进入阻塞状态
第二次,服务器监听到连接请求(即收到"SYN=1,Seq=J"包),调用accept函数接收请求并向客户端发送"ACK=1,ack=J+1 SYN=1,Seq=K",这时accept进入阻塞状态.
第三次,客户端收到服务器的"ACK=1,ack=J+1 SYN=1,Seq=K"之后,这时connect返回,并对"SYN=1,Seq=K"进行确认.服务器收到"ACK=1,ack=K+1,Seq=J+1"时,accept返回.至此三次握手完毕,连接建立
综上,客户端的connect在三次握手的第二个次返回,而服务器端的accept在三次握手的第三次返回TCP四次挥手之Socket
1
2
3
4
5
6第一次,某个应用进程首先调用close主动关闭连接,这时TCP发送一个"FIN=1 Seq=M",客户端进入FIN_WAIT_1
第二次,服务端接收到"FIN=1 Seq=M"之后,执行被动关闭,并返回"ACK=1,ack=M+1 Seq=V"进行确认.它的接收也作为文件结束符传递给应用进程,因为FIN的接收意味着应用进程在相应的连接上再也接收不到额外数据.此时服务端进入CLOSE_WAIT
第三次,一段时间之后,接收到文件结束符的应用进程调用close关闭它的socket.这导致它的TCP也发送一个"ACK=1,ack=M+1,FIN=1,Seq=K",此时服务端进入LAST_WAIT
第四次,客户端接收到这个"ACK=1,ack=M+1,FIN=1,Seq=K"后,进入TIME_WAIT,同时发送一个确认包"ACK=1,ack=K+1,Seq=M+1"给服务端,服务端进入CLOSE状态,完成四次挥手.
综上,客户端和服务端两边都会有一个FIN和ACK