一文搞懂，4种主要的 I/O 模型（高并发IO的底层原理）

文章目录前言4种主要的IO模型1.同步阻塞IO2. 同步非阻塞IO3. IO多路复用4. 异步I/O总结前言I/O是什么？I/O 就是计算机内存与外部设备之间拷贝数据的过程，CPU 访问内存的速度远远高于外部设备，因此 CPU 是先把外部设备的数据读到内存里，然后再进行处理I/O模型要解决的问题考虑一个实际场景：数据读取操作的基本流程，首先是在用户态发起调用操作，通过系统函数read()间接的调用

柏油

7022人浏览 · 2021-08-18 00:29:50

柏油 · 2021-08-18 00:29:50 发布

文章目录

前言
4种主要的IO模型
总结

前言

I/O是什么？

I/O 就是计算机内存与外部设备之间拷贝数据的过程，CPU 访问内存的速度远远高于外部设备，因此 CPU 是先把外部设备的数据读到内存里，然后再进行处理

I/O模型要解决的问题

考虑一个实际场景：数据读取操作的基本流程，首先是在用户态发起调用操作，通过系统函数read()间接的调用系统内核，从网卡读取数据，先将数据读取到内核缓冲区，再由内核缓冲区拷贝到用户态内存缓冲区
在这个过程中，涉及到cpu的操作、内存操作、外部物理设备操作；由于三者数据处理速度的巨大差异性，用户读取数据时，采用用户线程阻塞等待？非阻塞轮询查询并读取数据？还是由内核回调通知？这些便是I/O模型要解决的问题

I/O 模型的区别
当用户线程发起 I/O 操作后，网络数据读取操作会经历两个步骤：

用户线程等待内核将数据从网卡拷贝到内核空间。
内核将数据从内核空间拷贝到用户空间

各种 I/O 模型的区别就是：它们实现这两个步骤的方式是不一样的

4种主要的IO模型

1. 同步阻塞IO

用户线程发起 read 调用后就阻塞了，让出 CPU。内核等待网卡数据到来，把数据从网卡拷贝到内核空间，接着把数据拷贝到用户空间，再把用户线程叫醒
在这里插入图片描述

2. 同步非阻塞IO

用户线程不断的发起 read 调用，数据没到内核空间时，每次都返回失败，直到数据到了内核空间，这一次 read 调用后，在等待数据从内核空间拷贝到用户空间这段时间里，线程还是阻塞的，等数据到了用户空间再把线程叫醒
在这里插入图片描述
需要注意的是：这里通过用户线程自己去轮询读取数据，和I/O多路复用使用专用的线程去轮询处理(通常一个线程)不同

用户线程轮询发起read操作，如果数据未就绪，则立即返回；如正好数据准备就绪，则阻塞等待数据从内核拷贝到用户空间，再唤醒用户线程，read调用返回

3. IO多路复用

用户线程的读取操作分成两步了，线程先发起 select 调用，目的是问内核数据准备好了吗？等内核把数据准备好了，用户线程再发起 read 调用。在等待数据从内核空间拷贝到用户空间这段时间里，线程还是阻塞的。那为什么叫 I/O 多路复用呢？因为一个专用线程轮询发起 select 调用可以向内核查多个数据通道（Channel）的状态，所以叫多路复用

在这里插入图片描述

IO多路复用模型的基本原理就是select/epoll系统调用，单个线程不断的轮询select/epoll系统调用所负责的成百上千的socket连接，当某个或者某些socket网络连接有数据到达了，就返回这些可以读写的连接
这里select也是IO操作
首先发起select操作，如果检测到有通道数据准备就绪，则再发起一次read操作；CPU由用户态切换到内核态，执行内核代码，将用户线程挂起，然后把数据从内核空间拷贝到用户空间，再唤醒用户线程，read调用返回

4. 异步I/O

用户线程发起 read 调用的同时注册一个回调函数，read 立即返回，等内核将数据准备好后，再调用指定的回调函数完成处理。在这个过程中，用户线程一直没有阻塞
在这里插入图片描述

总结

1、同步非阻塞与I/O多路复用区别

相同点：都通过轮询的方式尝试读取数据；不同的是一个是由用户线程自己不断轮询，另一个是通过专用线程去轮询处理(专用线程数量可控)
同步非阻塞：用户线程不断轮询直到读取数据为止；这个过程中每个用户线程都是轮询读取，如果用户线程过多，耗费资源
I/O多路复用：一般通过一个专用线程去轮询检查数据是否就绪，由于一个专用线程可以处理多个连接(channel通道)，也就称为I/O多路复用；Java NIO便是I/O多路复用的一个实现

2、阻塞与非阻塞：指应用程序在发起 I/O 操作时，是立即返回还是等待

3、同步与异步：指应用程序在与内核通信时，数据从内核空间到应用空间的拷贝，是由内核主动发起还是由应用程序来触发；内核主动发起则是异步，反之为同步

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

深入理解Python的if __name__ == ‘__main__‘

python# 创建基类# 定义一对多关系# 定义多对一关系# 定义多对多关系（通过关联表）# 关联表（用于多对多关系）SQLAlchemy ORM提供了强大而灵活的数据库操作方式，通过本文的介绍，您应该能够：安装和配置SQLAlchemy定义数据模型和关系执行基本的CRUD操作构建复杂查询管理数据库事务遵循最佳实践SQLAlchemy还有更多高级特性，如混合属性、事件监听、自定义查询等，值得进一

2048 AI社区

“人类只剩最后5年”？人类智力的霸权时代，已进入倒计时。

据脉脉高聘人才智库2025年1-7月数据显示，薪资同比减少的AI岗位包括：数据开发（-33%）、前端（-5%）、测试工程师（-27%）、ios开发（-24%）、安卓开发（-16%）——这是根据脉脉平台上几乎囊括中国知名互联网公司在内的1000余家企业的招聘数据得出的统计。这份根据28.5万家企业，近6200万员工（2015-2025年）的美国简历和招聘职位数据对比得出的结论显示：自2023年起，采

2048 AI社区

摩尔定律已死，CUDA帝国永生

英伟达内部的每一位软件工程师和芯片设计师，都已经配备了AI协同工作的“同事”，结果是公司发展得更快，雇佣了更多的人，生产力、营收和盈利能力都更高。他认为智力不是零和游戏，周围聪明的人和工具越多，能想到的新点子、能解决的新问题就越多，创造的岗位也会越多。人工智能不再只是一个大型语言模型，而是一个由多个模型组成的系统，它们并发运行，有的在用工具，有的在做研究，并且这一切都是多模态的。第二个是“训练后”