多路复用io的原理
io多路复用的通俗理解:通过内核的监听事件,监视多个文件描述符,一旦某个文件发过来,读缓冲区就会有变化,内核就监听到了,就通知程序对文件读写。selcet函数是一个轮循函数,即当循环询问文件节点,可设置超时时间,超时时间到了就跳过代码继续往下执行。
1.概念
IO多路复用机制都是IO(读缓冲区和写缓冲区)同步机制,通过内核的监听事件,监视多个文件描述符,一旦某个文件发过来,读缓冲区就会有变化,内核就监听到了,就通知程序对文件读写。selcet函数是一个轮循函数,即当循环询问文件节点,可设置超时时间,超时时间到了就跳过代码继续往下执行。
2.select
2.1概念
select时间复杂度O(n),它仅仅知道有I/O事件发生了,但是不知道具体是哪几个流,所以只能无差别轮询,找到能读出的数据,或者写入数据的流,以便对它们操作。所以当流越多,越需要时间。
2.2函数原型
int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);
参数:
1.int maxfdp集合中所有文件描述符最大值+1,在windows中这个参数不重要,设置出错也没问题。
2.struct fd_set 存放文件描述符的集合,即文件句柄。fd_set集合可以通过一些宏由人为来操作。
宏:
FD_ZERO(fd_set *fdset) 清空fdset与所有文件句柄的联系。
FD_SET(int fd, fd_set *fdset) 建立文件句柄fd与fdset的联系。
FD_CLR(int fd, fd_set *fdset):清除文件句柄fd与fdset的联系。
FD_ISSET(int fd, fdset *fdset):检查fdset联系的文件句柄fd是否可读写,>0表示可读写。
3.struct timeval 有3种情况。
第一:传参为NULL,即不传入时间结构,表示select阻塞,一定要等到监视文件描述符集合中某个文件描述符发生变化为止。第二:传参为0秒0毫秒,让select变成非阻塞函数,不管文件描述符是否变化,都会返回继续执行,文件无变化返回0,有变化返回正值。第三:timeout的值大于0,这就是等待的超时时间,即select在timeout时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回。
struct timeval{
long tv_sec; //秒
long tv_usec; //毫秒
};
4.三个fd_set分别监视文件描述符的读写异常变化,如果有select会返回一个大于0的值。如果没有则在timeout的时间后select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的读/写/异常变化。
2.3 select机制
解select模型的关键在于理解fd_set,为说明方便,取fd_set长度为1字节,fd_set中的每一bit可以对应一个文件描述符fd。则1字节长的fd_set最大可以对应8个fd。
(1)执行fd_set set; FD_ZERO(&set);则set用位表示是0000,0000。
(2)若fd=5,执行FD_SET(fd,&set);后set变为0001,0000(第5位置为1)
(3)若再加入fd=2,fd=1,则set变为0001,0011
(4)执行select(6,&set,0,0,0)阻塞等待
(5)若fd=1,fd=2上都发生可读事件,则select返回,此时set变为0000,0011。注意:没有事件发生的fd=5被清空。
所以,我们可以得到select模型的特点:
(1) 文件描述符个数有限,一般来说这个数目和系统内存关系很大。select使用位域的方式来传递关心的文件描述符,位域就有最大长度。select使用位域的方式传回就绪的文件描述符,调用者需要循环遍历每一个位判断是否就绪,当文件描述符个数很多,但是空闲的文件描述符大大多于就绪的文件描述符的时候,效率很低。
(2) 将fd加入select监控集的同时,还要再使用一个数据结构array保存放到select监控集中的fd,一是用于再select 返回后,array作为源数据和fd_set进行FD_ISSET判断。二是select返回后会把以前加入的但并无事件发生的fd清空,则每次开始 select前都要重新从array取得fd逐一加入(FD_ZERO最先),扫描array的同时取得fd最大值maxfd,用于select的第一个 参数。
(3) 可见select模型必须在select前循环array(加fd,取maxfd),select返回后循环array(FD_ISSET判断是否有时间发生)。
3.poll
3.1 API
include
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
功能:监听多个文件描述符的属性变化
参数:
fds:指向struct pollfd的结构体的第0个值的指针。
struct pollfd{
int fd; //套接字
short events; //等待的事件
short revents; //实际发生的事件
};
nfds:指定第一个参数中结构体的个数
timeout:设定时间限制,超时后不管是否还有文件句柄改变函数都要返回
3.2 优点
1.不像select,只有1024个文件描述符的限制,poll没有文件描述符限制。
2.将输入输出参数进行分离,不用每次设定。