IO 作为操作系统的核心知识之一, 无论是在本机、传统的单体应用、还是分布式系统中,都有非常重要的地位.
今天就和大家系统地聊一聊 IO 相关的东西.
IO
IO,Input/Output 简写,是指内存和外设之间的数据复制的过程. 输入是指数据从外设复制到内存中, 输出则是指数据从内存复制到外设.
根据外设种类可以分为磁盘IO和网络IO, 因为外设的数据读写速率较低以及 IO 会涉及到系统调用以及中断,所以通常都会比较耗时。在程序优化时思路之一就是减少 IO 。
软件开发中的 IO
软件开发中各开发语言都提供了 IO 操作的方法或函数, 但应用程序在执行 IO 方法时, 实际上由两步完成,第一步:执行程序,发起系统调用,第二步系统执行 IO 。返回时则首先将数据读入到内核空间,然后内核空间再将数据复制给应用程序。
Unix IO 模型
Unix 根据应用程序 IO 的两个阶段特征将 IO 分为 5 种类型.
1. BIO
阻塞 IO, 服务器在 accept(),read(),write(), 数据没有 ready 前会一直阻塞线程.
2. NIO
非阻塞 IO, 服务器在 accept(),read(),write(), 数据没有 ready 会立刻返回异常.但为了能读到数据,需要应用程序不断地轮询.
3. IO 复用
在 java 中, 多路复用器 selector 也是 NIO 的核心组件, 利用操作系统的 select、poll、 epoll 机制,来对多个连接进行注册监听,使得一个线程也可以同时处理多个客户端.
Unix 中一切皆文件, 程序每次轮询检查时都意味着调用 select 系统调用来检查所有的 fd, 这个过程涉及到用户空间和内核空间的切换以及 fd 的拷贝.
while(true) {select.select();
}
4. 信号驱动 IO
通过通知的机制,使得在第一阶段不用阻塞调用进程(阻塞和轮询), 进程可以继续做其他事情,在一定程度提高了程序效率,但是在第二阶段数据复制过程仍然会阻塞进程.
5. AIO
NIO 在数据没有 ready 立刻返回异常, 后续需要不断地轮询, 这个过程也是非常低效的, 操作系统提供了异步通知机制: 一旦数据 ready 会自动通知调用线程.
总结
BIO 、NIO、IO复用、以及信号驱动IO, 由于第二阶段的数据复制过程, 调用线程都会被阻塞, 因此都属于同步IO.
如果觉得还不错的话,关注、分享、在看(关注不失联~), 原创不易,且看且珍惜~