位置: 编程技术 - 正文

总结网络IO模型与select模型的Python实例讲解(总结网络io模型的特点)

编辑:rootadmin

推荐整理分享总结网络IO模型与select模型的Python实例讲解(总结网络io模型的特点),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:ip网络模型,5种网络io模型,5种网络io模型,ip网络模型,5种网络io模型,总结网络io模型的优缺点,总结网络io模型的过程,总结网络io模型的过程,内容如对您有帮助,希望把文章链接给更多的朋友!

网络I/O模型人多了,就会有问题。web刚出现的时候,光顾的人很少。近年来网络应用规模逐渐扩大,应用的架构也需要随之改变。Ck的问题,让工程师们需要思考服务的性能与应用的并发能力。

网络应用需要处理的无非就是两大类问题,网络I/O,数据计算。相对于后者,网络I/O的延迟,给应用带来的性能瓶颈大于后者。网络I/O的模型大致有如下几种:

同步模型(synchronous I/O) 阻塞I/O(bloking I/O) 非阻塞I/O(non-blocking I/O) 多路复用I/O(multiplexing I/O) 信号驱动式I/O(signal-driven I/O) 异步I/O(asynchronous I/O)

网络I/O的本质是socket的读取,socket在linux系统被抽象为流,I/O可以理解为对流的操作。这个操作又分为两个阶段:

等待流数据准备(wating for the data to be ready)。从内核向进程复制数据(copying the data from the kernel to the process)。对于socket流而已,

第一步通常涉及等待网络上的数据分组到达,然后被复制到内核的某个缓冲区。第二步把数据从内核缓冲区复制到应用进程缓冲区。I/O模型:举个简单比喻,来了解这几种模型。网络IO好比钓鱼,等待鱼上钩就是网络中等待数据准备好的过程,鱼上钩了,把鱼拉上岸就是内核复制数据阶段。钓鱼的人就是一个应用进程。

阻塞I/O(bloking I/O)阻塞I/O是最流行的I/O模型。它符合人们最常见的思考逻辑。阻塞就是进程 "被" 休息, CPU处理其它进程去了。在网络I/O的时候,进程发起recvform系统调用,然后进程就被阻塞了,什么也不干,直到数据准备好,并且将数据从内核复制到用户进程,最后进程再处理数据,在等待数据到处理数据的两个阶段,整个进程都被阻塞。不能处理别的网络I/O。大致如下图:

这就好比我们去钓鱼,抛竿之后就一直在岸边等,直到等待鱼上钩。然后再一次抛竿,等待下一条鱼上钩,等待的时候,什么事情也不做,大概会胡思乱想吧。

阻塞IO的特点就是在IO执行的两个阶段都被block了非阻塞I/O(non-bloking I/O)在网络I/O时候,非阻塞I/O也会进行recvform系统调用,检查数据是否准备好,与阻塞I/O不一样,"非阻塞将大的整片时间的阻塞分成N多的小的阻塞, 所以进程不断地有机会 '被' CPU光顾"。

也就是说非阻塞的recvform系统调用调用之后,进程并没有被阻塞,内核马上返回给进程,如果数据还没准备好,此时会返回一个error。进程在返回之后,可以干点别的事情,然后再发起recvform系统调用。重复上面的过程,循环往复的进行recvform系统调用。这个过程通常被称之为轮询。轮询检查内核数据,直到数据准备好,再拷贝数据到进程,进行数据处理。需要注意,拷贝数据整个过程,进程仍然是属于阻塞的状态。

我们再用钓鱼的方式来类别,当我们抛竿入水之后,就看下鱼漂是否有动静,如果没有鱼上钩,就去干点别的事情,比如再挖几条蚯蚓。然后不久又来看看鱼漂是否有鱼上钩。这样往返的检查又离开,直到鱼上钩,再进行处理。

非阻塞 IO的特点是用户进程需要不断的主动询问kernel数据是否准备好。多路复用I/O(multiplexing I/O)可以看出,由于非阻塞的调用,轮询占据了很大一部分过程,轮询会消耗大量的CPU时间。结合前面两种模式。如果轮询不是进程的用户态,而是有人帮忙就好了。多路复用正好处理这样的问题。

多路复用有两个特别的系统调用select或poll。select调用是内核级别的,select轮询相对非阻塞的轮询的区别在于---前者可以等待多个socket,当其中任何一个socket的数据准好了,就能返回进行可读,然后进程再进行recvform系统调用,将数据由内核拷贝到用户进程,当然这个过程是阻塞的。多路复用有两种阻塞,select或poll调用之后,会阻塞进程,与第一种阻塞不同在于,此时的select不是等到socket数据全部到达再处理, 而是有了一部分数据就会调用用户进程来处理。如何知道有一部分数据到达了呢?监视的事情交给了内核,内核负责数据到达的处理。也可以理解为"非阻塞"吧。

对于多路复用,也就是轮询多个socket。钓鱼的时候,我们雇了一个帮手,他可以同时抛下多个钓鱼竿,任何一杆的鱼一上钩,他就会拉杆。他只负责帮我们钓鱼,并不会帮我们处理,所以我们还得在一帮等着,等他把收杆。我们再处理鱼。多路复用既然可以处理多个I/O,也就带来了新的问题,多个I/O之间的顺序变得不确定了,当然也可以针对不同的编号。

总结网络IO模型与select模型的Python实例讲解(总结网络io模型的特点)

多路复用的特点是通过一种机制一个进程能同时等待IO文件描述符,内核监视这些文件描述符(套接字描述符),其中的任意一个进入读就绪状态,select, poll,epoll函数就可以返回。对于监视的方式,又可以分为 select, poll, epoll三种方式。了解了前面三种模式,在用户进程进行系统调用的时候,他们在等待数据到来的时候,处理的方式不一样,直接等待,轮询,select或poll轮询,第一个过程有的阻塞,有的不阻塞,有的可以阻塞又可以不阻塞。当时第二个过程都是阻塞的。从整个I/O过程来看,他们都是顺序执行的,因此可以归为同步模型(asynchronous)。都是进程主动向内核检查。

异步I/O(asynchronous I/O)相对于同步I/O,异步I/O不是顺序执行。用户进程进行aio_read系统调用之后,无论内核数据是否准备好,都会直接返回给用户进程,然后用户态进程可以去做别的事情。等到socket数据准备好了,内核直接复制数据给进程,然后从内核向进程发送通知。I/O两个阶段,进程都是非阻塞的。

比之前的钓鱼方式不一样,这一次我们雇了一个钓鱼高手。他不仅会钓鱼,还会在鱼上钩之后给我们发短信,通知我们鱼已经准备好了。我们只要委托他去抛竿,然后就能跑去干别的事情了,直到他的短信。我们再回来处理已经上岸的鱼。

同步和异步的区别通过对上述几种模型的讨论,需要区分阻塞和非阻塞,同步和异步。他们其实是两组概念。区别前一组比较容易,后一种往往容易和前面混合。在我看来,所谓同步就是在整个I/O过程。尤其是拷贝数据的过程是阻塞进程的,并且都是应用进程态去检查内核态。而异步则是整个过程I/O过程用户进程都是非阻塞的,并且当拷贝数据的时是由内核发送通知给用户进程。

对于同步模型,主要是第一阶段处理方法不一样。而异步模型,两个阶段都不一样。这里我们忽略了信号驱动模式。这几个名词还是容易让人迷惑,只有同步模型才考虑阻塞和非阻塞,因为异步肯定是非阻塞,异步非阻塞的说法感觉画蛇添足。

Select 模型同步模型中,使用多路复用I/O可以提高服务器的性能。在多路复用的模型中,比较常用的有select模型和poll模型。这两个都是系统接口,由操作系统提供。当然,Python的select模块进行了更高级的封装。select与poll的底层原理都差不多。千呼万唤始出来,本文的重点select模型。1.select 原理网络通信被Unix系统抽象为文件的读写,通常是一个设备,由设备驱动程序提供,驱动可以知道自身的数据是否可用。支持阻塞操作的设备驱动通常会实现一组自身的等待队列,如读/写等待队列用于支持上层(用户层)所需的block或non-block操作。设备的文件的资源如果可用(可读或者可写)则会通知进程,反之则会让进程睡眠,等到数据到来可用的时候,再唤醒进程。

这些设备的文件描述符被放在一个数组中,然后select调用的时候遍历这个数组,如果对于的文件描述符可读则会返回改文件描述符。当遍历结束之后,如果仍然没有一个可用设备文件描述符,select让用户进程则会睡眠,直到等待资源可用的时候在唤醒,遍历之前那个监视的数组。每次遍历都是线性的。

2.select 回显服务器select涉及系统调用和操作系统相关的知识,因此单从字面上理解其原理还是比较乏味。用代码来演示最好不过了。使用python的select模块很容易写出下面一个回显服务器:

运行上述代码,使用curl访问 request信息。

下面详细解析上述代码的原理。

上述代码使用socket初始化一个TCP套接字,并绑定主机地址和端口,然后设置服务器监听。

这里定义了一个需要select监听的列表,列表里面是需要监听的对象(等于系统监听的文件描述符)。这里监听socket套接字和用户的输入。

然后代码进行一个服务器无线循环。

调用了select函数,开始循环遍历监听传入的列表inputs。如果没有curl服务器,此时没有建立tcp客户端连接,因此改列表内的对象都是数据资源不可用。因此select阻塞不返回。

客户端输入curl nodejs都是基于epoll进行的异步。

Python的Flask框架及Nginx实现静态文件访问限制功能 Nginx配置Ngnix,一个高性能的web服务器,毫无疑问它是当下的宠儿。卓越的性能,灵活可扩展,在服务器领域里攻城拔寨,征战天下。静态文件对于大多

Python的string模块中的Template类字符串模板用法 string.Template()string.Template()内添加替换的字符,使用"$"符号,或在字符串内,使用"${}";调用时使用string.substitute(dict)函数.可以通过继承"string.Template",覆盖变量d

Python中的字符串替换操作示例 字符串的替换(interpolation),可以使用string.Template,也可以使用标准字符串的拼接.string.Template标示替换的字符,使用"$"符号,或在字符串内,使用"${}";调用时使

标签: 总结网络io模型的特点

本文链接地址:https://www.jiuchutong.com/biancheng/387649.html 转载请保留说明!

上一篇:结合Python的SimpleHTTPServer源码来解析socket通信(python simple)

下一篇:Python的Flask框架及Nginx实现静态文件访问限制功能(flask框架官方文档)

  • 计提生产应税产品的分录
  • 土地税税额标准
  • 提供维修业务的税率
  • 疫情期间固定资产折旧优惠政策
  • 销售净收入咋算
  • 盘盈的固定资产怎么做账务处理
  • 个体每月开票超10万
  • 非财政补助结余分配期末有余额吗
  • 科目汇总表的登记方法
  • 虚开增值税发票的涉税风险如何防范
  • 取得的管理部门证书
  • 营业执照年审后日期会变吗
  • 应付职工薪酬如何填列
  • 增值税当月抵扣吗
  • 库存商品期末要结转吗
  • 劳动仲裁是怎样仲裁公司的
  • 年终奖可以分几次发吗?
  • 酒店会务费发票税率
  • 电梯增值税率是多少
  • 税收楔子是什么意思
  • 会展服务服务费怎么是免税
  • 法人可以公司账户存款吗
  • 代开专票时城建税一起扣了季报怎么报税
  • 附加税有哪些税种
  • win10玩游戏提示内存不足无法处理此命令
  • 月末结转损益类科目为零对吗
  • 股利分配账务处理
  • 查账征收的个独可以随意分配利润吗
  • 家庭版系统如何重装成专业版本
  • 递延所得税当期要交吗
  • win10任务栏搜索如何关闭
  • 企业存款利息收入增值税
  • 商贸企业税收优惠政策
  • 地下停车位是否符合国家安全标准咨询那个部门
  • ts基础类型
  • 金融机构同业外汇存款账户管理办法
  • json与json字符串
  • 小微企业免教育附加
  • 分配股利账务处理
  • echarts-gl
  • bootz命令
  • php打不开网页
  • 餐饮业的原材料
  • 房地产企业税负低如何向税务局解释
  • 商场返点怎么核算
  • 对外捐赠的会计处理企业会计准则和小企业会计准则
  • 购买方销项负数发票怎么抵扣
  • 建筑公司是可以开在住宅小区吗
  • 固定资产怎么进行无形资产清理的
  • 金税四期能监控到公户吗
  • 公司贷款可以转私户吗
  • 工商年报纳税总额从哪看
  • 消费税和购置税系重复征税
  • 工资能否当月计提当月发放
  • 企业减资要交税嘛
  • 4s店出售试驾车的增值税是多少
  • 核定征收小规模做汇算清缴吗
  • 外贸整个流程图
  • sql中的非逻辑
  • Win7/Win8.1/Win10的UAC对话框“是”点不了的原因及解决方法
  • 重装系统要懂什么
  • 在bois如何设置C盘启动
  • “explorer.exe”进程文件
  • win102020h2
  • windows xp玩lol
  • 如何教新手
  • cocos2dx入门
  • react增删改查功能
  • cordova怎么样
  • layui框架中修改用户成功后怎么跳转到登录界面
  • javascript解析器
  • css总结笔记
  • javascript中获取字符串长度
  • javascript基础入门视频教程
  • s='python is beautiful!'
  • jquery创建map集合
  • 微信扫码开票的记录怎么查询
  • 深圳税务 qzzn
  • 神州浩天财务软件
  • 房产税怎么计提和缴纳分录
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设