前言

I/O是什么?

I/O 就是计算机内存与外部设备之间拷贝数据的过程,CPU 访问内存的速度远远高于外部设备,因此 CPU 是先把外部设备的数据读到内存里,然后再进行处理

I/O模型要解决的问题

  • 考虑一个实际场景:数据读取操作的基本流程,首先是在用户态发起调用操作,通过系统函数read()间接的调用系统内核,从网卡读取数据,先将数据读取到内核缓冲区,再由内核缓冲区拷贝到用户态内存缓冲区

  • 在这个过程中,涉及到cpu的操作、内存操作、外部物理设备操作;由于三者数据处理速度的巨大差异性,用户读取数据时,采用 用户线程阻塞等待?非阻塞轮询查询并读取数据?还是由内核回调通知?这些便是I/O模型要解决的问题

I/O 模型的区别
当用户线程发起 I/O 操作后,网络数据读取操作会经历两个步骤:

  • 用户线程等待内核将数据从网卡拷贝到内核空间。
  • 内核将数据从内核空间拷贝到用户空间

各种 I/O 模型的区别就是:它们实现这两个步骤的方式是不一样的

4种主要的IO模型

1. 同步阻塞IO

用户线程发起 read 调用后就阻塞了,让出 CPU。内核等待网卡数据到来,把数据从网卡拷贝到内核空间,接着把数据拷贝到用户空间,再把用户线程叫醒
在这里插入图片描述

2. 同步非阻塞IO

用户线程不断的发起 read 调用,数据没到内核空间时,每次都返回失败,直到数据到了内核空间,这一次 read 调用后,在等待数据从内核空间拷贝到用户空间这段时间里,线程还是阻塞的,等数据到了用户空间再把线程叫醒
在这里插入图片描述
需要注意的是:这里通过用户线程自己去轮询读取数据,和I/O多路复用使用专用的线程去轮询处理(通常一个线程)不同

用户线程轮询发起read操作,如果数据未就绪,则立即返回;如正好数据准备就绪,则阻塞等待数据从内核拷贝到用户空间,再唤醒用户线程,read调用返回

3. IO多路复用

用户线程的读取操作分成两步了,线程先发起 select 调用,目的是问内核数据准备好了吗?等内核把数据准备好了,用户线程再发起 read 调用。在等待数据从内核空间拷贝到用户空间这段时间里,线程还是阻塞的。那为什么叫 I/O 多路复用呢?因为一个专用线程轮询发起 select 调用可以向内核查多个数据通道(Channel)的状态,所以叫多路复用

在这里插入图片描述

  • IO多路复用模型的基本原理就是select/epoll系统调用,单个线程不断的轮询select/epoll系统调用所负责的成百上千的socket连接,当某个或者某些socket网络连接有数据到达了,就返回这些可以读写的连接
  • 这里select也是IO操作
  • 首先发起select操作,如果检测到有通道数据准备就绪,则再发起一次read操作;CPU由用户态切换到内核态,执行内核代码,将用户线程挂起,然后把数据从内核空间拷贝到用户空间,再唤醒用户线程,read调用返回

4. 异步I/O

用户线程发起 read 调用的同时注册一个回调函数,read 立即返回,等内核将数据准备好后,再调用指定的回调函数完成处理。在这个过程中,用户线程一直没有阻塞
在这里插入图片描述

总结

1、同步非阻塞与I/O多路复用区别

  • 相同点:都通过轮询的方式尝试读取数据;不同的是 一个是由用户线程自己不断轮询,另一个是通过专用线程去轮询处理(专用线程数量可控)
  • 同步非阻塞:用户线程不断轮询直到读取数据为止;这个过程中每个用户线程都是轮询读取,如果用户线程过多,耗费资源
  • I/O多路复用:一般通过一个专用线程去轮询检查数据是否就绪,由于一个专用线程可以处理多个连接(channel通道),也就称为I/O多路复用;Java NIO便是I/O多路复用的一个实现

2、阻塞与非阻塞:指应用程序在发起 I/O 操作时,是立即返回还是等待

3、同步与异步:指应用程序在与内核通信时,数据从内核空间到应用空间的拷贝,是由内核主动发起还是由应用程序来触发;内核主动发起则是异步,反之为同步

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐