多路复用io的原理

Z, ZLW 212

io多路复用的通俗理解:通过内核的监听事件,监视多个文件描述符,一旦某个文件发过来,读缓冲区就会有变化,内核就监听到了,就通知程序对文件读写。selcet函数是一个轮循函数,即当循环询问文件节点,可设置超时时间,超时时间到了就跳过代码继续往下执行。

1.概念

IO多路复用机制都是IO(读缓冲区和写缓冲区)同步机制,通过内核的监听事件,监视多个文件描述符,一旦某个文件发过来,读缓冲区就会有变化,内核就监听到了,就通知程序对文件读写。selcet函数是一个轮循函数,即当循环询问文件节点,可设置超时时间,超时时间到了就跳过代码继续往下执行。

2.select

2.1概念
select时间复杂度O(n),它仅仅知道有I/O事件发生了,但是不知道具体是哪几个流,所以只能无差别轮询,找到能读出的数据,或者写入数据的流,以便对它们操作。所以当流越多,越需要时间。

2.2函数原型
int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);
参数:

    1.int maxfdp集合中所有文件描述符最大值+1,在windows中这个参数不重要,设置出错也没问题。

    2.struct fd_set 存放文件描述符的集合,即文件句柄。fd_set集合可以通过一些宏由人为来操作。

    宏:

FD_ZERO(fd_set *fdset) 清空fdset与所有文件句柄的联系。
FD_SET(int fd, fd_set *fdset) 建立文件句柄fd与fdset的联系。
FD_CLR(int fd, fd_set *fdset):清除文件句柄fd与fdset的联系。
FD_ISSET(int fd, fdset *fdset):检查fdset联系的文件句柄fd是否可读写,>0表示可读写。

3.struct timeval 有3种情况。

第一:传参为NULL,即不传入时间结构,表示select阻塞,一定要等到监视文件描述符集合中某个文件描述符发生变化为止。第二:传参为0秒0毫秒,让select变成非阻塞函数,不管文件描述符是否变化,都会返回继续执行,文件无变化返回0,有变化返回正值。第三:timeout的值大于0,这就是等待的超时时间,即select在timeout时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回。

struct timeval{
long tv_sec; //秒
long tv_usec; //毫秒

};
4.三个fd_set分别监视文件描述符的读写异常变化,如果有select会返回一个大于0的值。如果没有则在timeout的时间后select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的读/写/异常变化。

2.3 select机制
解select模型的关键在于理解fd_set,为说明方便,取fd_set长度为1字节,fd_set中的每一bit可以对应一个文件描述符fd。则1字节长的fd_set最大可以对应8个fd。

(1)执行fd_set set; FD_ZERO(&set);则set用位表示是0000,0000。

(2)若fd=5,执行FD_SET(fd,&set);后set变为0001,0000(第5位置为1)

(3)若再加入fd=2,fd=1,则set变为0001,0011

(4)执行select(6,&set,0,0,0)阻塞等待

(5)若fd=1,fd=2上都发生可读事件,则select返回,此时set变为0000,0011。注意:没有事件发生的fd=5被清空。

所以,我们可以得到select模型的特点:
(1) 文件描述符个数有限,一般来说这个数目和系统内存关系很大。select使用位域的方式来传递关心的文件描述符,位域就有最大长度。select使用位域的方式传回就绪的文件描述符,调用者需要循环遍历每一个位判断是否就绪,当文件描述符个数很多,但是空闲的文件描述符大大多于就绪的文件描述符的时候,效率很低。

(2) 将fd加入select监控集的同时,还要再使用一个数据结构array保存放到select监控集中的fd,一是用于再select 返回后,array作为源数据和fd_set进行FD_ISSET判断。二是select返回后会把以前加入的但并无事件发生的fd清空,则每次开始 select前都要重新从array取得fd逐一加入(FD_ZERO最先),扫描array的同时取得fd最大值maxfd,用于select的第一个 参数。

(3) 可见select模型必须在select前循环array(加fd,取maxfd),select返回后循环array(FD_ISSET判断是否有时间发生)。

3.poll
3.1 API

include

int poll(struct pollfd *fds, nfds_t nfds, int timeout);
功能:监听多个文件描述符的属性变化
参数:
fds:指向struct pollfd的结构体的第0个值的指针。
struct pollfd{
int fd; //套接字
short events; //等待的事件
short revents; //实际发生的事件
};
nfds:指定第一个参数中结构体的个数
timeout:设定时间限制,超时后不管是否还有文件句柄改变函数都要返回
3.2 优点
1.不像select,只有1024个文件描述符的限制,poll没有文件描述符限制。

2.将输入输出参数进行分离,不用每次设定。

回复

我来回复
  • 暂无回复内容

注册PingCode 在线客服
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部