位置: 编程技术 - 正文

Python 多核并行计算的示例代码(python多核并行处理)

编辑:rootadmin

推荐整理分享Python 多核并行计算的示例代码(python多核并行处理),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python 多核并行 windows,python多核并行处理,python多核并行处理,python 多核并行计算,python多核并行处理,python多核并行处理,python 多核并行 windows,python 多核并行计算,内容如对您有帮助,希望把文章链接给更多的朋友!

以前写点小程序其实根本不在乎并行,单核跑跑也没什么问题,而且我的电脑也只有双核四个超线程(下面就统称核好了),觉得去折腾并行没啥意义(除非在做IO密集型任务)。然后自从用上了核GB内存,看到 htop 里面一堆空载的核,很自然地就会想这个并行必须去折腾一下。后面发现,其实 Python 的并行真的非常简单。

multiprocessing vs threading

Python 自带的库又全又好用,这是我特别喜欢 Python 的原因之一。Python 里面有 multiprocessing和 threading 这两个用来实现并行的库。用线程应该是很自然的想法,毕竟(直觉上)开销小,还有共享内存的福利,而且在其他语言里面线程用的确实是非常频繁。然而,我可以很负责任的说,如果你用的是 CPython 实现,那么用了 threading 就等同于和并行计算说再见了(实际上,甚至会比单线程更慢),除非这是个IO密集型的任务。

GIL

CPython 指的是 python.org 提供的 Python 实现。是的,Python 是一门语言,它有各种不同的实现,比如 PyPy, Jython, IronPython 等等……我们用的最多的就是 CPython,它几乎就和 Python 画上了等号。

CPython 的实现中,使用了 GIL 即全局锁,来简化解释器的实现,使得解释器每次只执行一个线程中的字节码。也就是说,除非是在等待IO操作,否则 CPython 的多线程就是彻底的谎言!

有关 GIL 下面两个资料写的挺好的:

GIL 的缘故 threading 不能用,那么我们就好好研究研究 multiprocessing。(当然,如果你说你不用 CPython,没有 GIL 的问题,那也是极佳的。)

Python 多核并行计算的示例代码(python多核并行处理)

首先介绍一个简单粗暴,非常实用的工具,就是 multiprocessing.Pool。如果你的任务能用 ys = map(f, xs) 来解决,大家可能都知道,这样的形式天生就是最容易并行的,那么在 Python 里面并行计算这个任务真是再简单不过了。举个例子,把每个数都平方:

map 直接返回列表,而 i 开头的两个函数返回的是迭代器;imap_unordered 返回的是无序的。

当计算时间比较长的时候,我们可能想要加上一个进度条,这个时候 i 系列的好处就体现出来了。另外,有一个小技巧,就是输出 r 可以使得光标回到行首而不换行,这样就可以制作简易的进度条了。

更复杂的操作

要进行更复杂的操作,可以直接使用 multiprocessing.Process 对象。要在进程间通信可以使用:

multiprocessing.Pipe multiprocessing.Queue 同步原语 共享变量

其中我强烈推荐的就是 Queue,因为其实很多场景就是生产者消费者模型,这个时候用 Queue 就解决问题了。用的方法也很简单,现在父进程创建 Queue,然后把它当做 args 或者 kwargs 传给 Process 就好了。

使用 Theano 或者 Tensorflow 等工具时的注意事项

需要注意的是,在 import theano 或者 import tensorflow 等调用了 Cuda 的工具的时候会产生一些副作用,这些副作用会原样拷贝到子进程中,然后就发生错误,如:

could not retrieve CUDA device count: CUDA_ERROR_NOT_INITIALIZED

解决的方法是,保证父进程不引入这些工具,而是在子进程创建好了以后,让子进程各自引入。

如果使用 Process,那就在 target 函数里面 import。举个例子:

如果使用 Pool,那么可以编写一个函数,在这个函数里面 import,并且把这个函数作为 initializer传入到 Pool 的构造函数里面。举个例子:

标签: python多核并行处理

本文链接地址:https://www.jiuchutong.com/biancheng/372180.html 转载请保留说明!

上一篇:python判断字符串是否是json格式方法分享(Python判断字符串结尾并输出yes或no)

下一篇:python生成excel的实例代码(python怎么生成excel)

  • 电子税务局怎么添加办税人员
  • 工资储备金制度
  • 销货退回的税务处理
  • 营改增后企业所得税分成比例
  • 发票遗失如何报销
  • 增值税小规模纳税人起征点
  • 固定资产处置损益怎么算
  • 出口退税新旧申报
  • 持有待售资产固定资产 要计提折旧吗
  • 盘亏设备一台
  • 苗木增值税发票税率
  • 购买烟怎么做账
  • 旅游企业小规模纳税人差额征收
  • 2018一般纳税人印花税减半吗
  • 增值税在免税范围内,附加税怎么做
  • 股份转让的溢价是什么意思
  • 增值税减免税如何处理
  • 国税退税怎么做账
  • 制造费用包括哪些费用项目
  • 发工资时忘记扣个税了怎么做账
  • 账面上挂的其他应付款怎么冲平?
  • 工会经费怎么使用
  • 增值税发票税率怎么算
  • 预付卡销售怎么做账
  • 电脑显示器模糊不清晰是什么原因
  • 商业承兑汇票提示承兑期限
  • 树上有只松鼠简笔画
  • 入库前仓储费用应计入
  • 公司注销职工安置方案
  • 理财计算收益公式
  • 做事应该怎么做
  • 工程物资发生报废损毁
  • php公众号推送完整示例
  • 损益类科目月末结转到哪个科目
  • linuxvim批量替换
  • 股权转让撤回投资
  • 如何免费使用超级简历
  • php判断是手机端还是端口
  • 国内旅客运输服务发票
  • 进项逾期未认证怎么办
  • web前端视频教程全套
  • chatteing
  • 出口退税率和进口税率的区别
  • 行政事业单位怎么开发票
  • 帝国cms源码
  • 年末结转增值税明细
  • 视同内销补税的财务处理
  • 纳税总额怎么算
  • 小规模差额征税的账务处理
  • 电子承兑汇票的最长期限
  • 资产负债表可以反映的具体信息有
  • 纳税人将购买的货物分配给股东,因该货物购买时已缴纳
  • 股东撤资如何退还资金,用途写什么
  • 一般纳税人城建税税率是多少
  • 企业跨年度的收入退回应该如何进行会计处理?
  • 应收账款的财务指标有哪些
  • 销售折扣怎么制定
  • 企业股东撤资如何清算
  • 老板在自己的公司做事
  • 滞纳金是罚款支出吗
  • 会计账本怎么记账
  • 企业支付宝问题解决
  • 劳动者权益包含哪些
  • debian iso
  • mac的vmware
  • giantantispywaremain.exe是什么进程 有什么作用 giantantispywaremain进程查询
  • mac系统怎么设置字体大小
  • javascript中的eval函数
  • android canvas scale
  • ssh -keygen
  • 原生javascript+css3编写的3D魔方动画旋扭特效
  • service与activity数据交互
  • python中os模块有什么作用
  • jquery attribute
  • 外经证怎么核验
  • 银行关联方认定标准是什么
  • 20年灵活就业人员社保新标准
  • 如何打印个税缴纳记录
  • 贝壳的贝壳分
  • 三国杀马钧获取
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设