位置: IT常识 - 正文

Pytorch深度学习实战3-6:详解网络骨架模块nn.Module(附实例)

编辑:rootadmin
原力计划Pytorch深度学习实战3-6:详解网络骨架模块nn.Module(附实例) 目录1 什么是nn.Module?2 从一个例子说起3 nn.Module主要方法4 自定义网络一般步骤1 什么是nn.Module?

推荐整理分享Pytorch深度学习实战3-6:详解网络骨架模块nn.Module(附实例),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

在实际应用过程中,经典网络结构(如卷积神经网络)往往不能满足我们的需求,因而大多数时候都需要自定义模型,比如:多输入多输出(MIMO)、多分支模型、跨层连接模型等。nn.Module就是Pytorch中用于自定义模型的核心方法。在Pytorch中,自定义层、自定义块、自定义模型,都是通过继承nn.Module类完成的。

nn.Module的定义如下

class Module(object): def __init__(self): def forward(self, *input): def __call__(self, *input, **kwargs): def parameters(self, recurse=True): def named_parameters(self, prefix='', recurse=True): def children(self): def named_children(self): def modules(self): def named_modules(self, memo=None, prefix=''): def train(self, mode=True): def eval(self): def zero_grad(self):...

注意:自定义网络需要继承nn.Module类,并重点实现上面的构造函数__init__构造函数和forward()这两个方法。

2 从一个例子说起

下面是一个自定义感知机的实例

# 感知机class Perception(nn.Module): def __init__(self, inDim, hidDim, outDim): super(Perception, self).__init__() self.perception = nn.Sequential( nn.Linear(inDim, hidDim), nn.Sigmoid(), nn.Linear(hidDim, outDim), nn.Sigmoid() ) def forward(self, x): return self.perception(x)

测试模块

perception = Perception(5,20,10)print(perception(torch.Tensor([1,2,3,4,5]))) # 自动调用forward()前向传播

其中nn.Sequential()可以序列化封装若干个相连的组件,在希望快速搭建模型且无需考虑中间过程的情形下,推荐使用nn.Sequential()进行局部模块化。

Pytorch深度学习实战3-6:详解网络骨架模块nn.Module(附实例)

从上面的实例可以看出:

一般把网络中的特定结构(如全连接层、卷积层等)以序列的形式放在构造函数__init__()中将模型自定义的各个层的连接关系和数据通路设计放在forward()函数中,以实现模型功能并保证数据结构正常不具有可学习参数的层(如ReLU、dropout、BatchNormanation层等)可并入__init__()内部的某个层,或在forward()函数中进行层间连接

库nn.functional同样提供了大量网络模块和组件,与nn.Module类不同在于其更偏向底层——nn.Module封装了对学习参数的维护,更注重模型结构;nn.functional需要手动指定参数和结构,例如下面线性模型Linear的核心源码,其前向过程仍然调用了底层的nn.functional实现。

class Linear(Module): def __init__(self, in_features: int, out_features: int) -> None: super(Linear, self).__init__() self.in_features = in_features self.out_features = out_features self.weight = Parameter(torch.Tensor(out_features, in_features)) self.bias = Parameter(torch.Tensor(out_features)) def forward(self, input: Tensor) -> Tensor: return F.linear(input, self.weight, self.bias)

一般在设计通过已有nn.Module无法组装的网络结构时,可以调用底层的nn.functional实现;或是存在无需优化学习参数的结构(如损失函数、激活函数等),可以调用nn.functional(即作为单纯函数使用)避免实例化nn.Module,轻量化网络

# 使用nn.Module需要实例化后调用lossFunc = nn.CrossEntropyLoss()loss = lossFunc(output, label)# 使用nn.functional则只作为函数即可loss = F.cross_entropy(output, label)3 nn.Module主要方法

nn.Module的主要属性与方法列举如表所示。

序号属性/方法含义1forward()模型前向传播2train()训练模式3eval()评估模式4named_parameters()返回模型各可学习参数的名称和参数组成的列表5parameters()返回模型各可学习参数组成的列表6children()返回一个迭代器,其中每个元素是Sequential序列类型,可以使用下标索引来进一步获取每一个Sequenrial里面的具体层,比如conv层、dense层等7named_children()返回一个迭代器,其中每个元素是一个二元组,第一元是名称,第二元是该名称对应的层或Sequential序列4 自定义网络一般步骤

自定义网络一般步骤总结如下:

自定义一个继承自Module的类实现构造函数_init__,在其中参数化网络层,比如卷积神经网络的卷积核大小、池化层尺寸,全连接网络的输入输出大小等;实现前向传播forward()接口,定义网络的连接情况或其他运算方式(如向量拼接、向量变维、数据处理等)

下面再给出一个卷积神经网络的实例加深理解

class CNN(nn.Module): def __init__(self): super().__init__() self.convPoolLayer_1 = nn.Sequential( nn.Conv2d(in_channels=1, out_channels=10, kernel_size=5), nn.MaxPool2d(kernel_size=2), nn.ReLU() ) self.convPoolLayer_2 = nn.Sequential( nn.Conv2d(in_channels=10, out_channels=20, kernel_size=5), nn.MaxPool2d(kernel_size=2), nn.ReLU() ) self.fcLayer = nn.Linear(320, 10) def __str__(self) -> str: return "cnn_model" def forward(self, x): batchSize = x.size(0) x = self.convPoolLayer_1(x) x = self.convPoolLayer_2(x) x = x.reshape(batchSize, -1) x = self.fcLayer(x) return x


🔥 更多精彩专栏:

《ROS从入门到精通》《Pytorch深度学习实战》《机器学习强基计划》《运动规划实战精讲》…

👇源码获取 · 技术交流 · 抱团学习 · 咨询分享 请联系👇

本文链接地址:https://www.jiuchutong.com/zhishi/297615.html 转载请保留说明!

上一篇:【Vant Weapp】van-tab 标签页(vant weapp官方文档)

下一篇:Django--基于Python的Web应用框架(django pycharm)

  • 企业所得税的计提和缴纳分录
  • 代扣代缴个人所得税手续费返还 增值税
  • 备案办税人员信息填本人的有风险吗
  • 算税负是用含税的吗
  • 发票盖了财务专用章旁边再盖发票章
  • 员工加班餐费计入会计什么科目
  • 横幅属于什么发票范围
  • 印花税多报了几块钱税务局会找我吗
  • 合作社需要办什么证件
  • 汇算清缴退回的所得税
  • 收到投资款怎么做会计凭证
  • 怎么处理善意取得的大头小尾发票?
  • 设备投入安装计入什么科目
  • 分配利润和分配股利
  • 公司股权折价收入怎么算
  • 会计科目应收账款什么意思
  • 股票印花税怎么交
  • 国家税务总局11号令
  • 财务软件操作指南
  • 股权激励取消怎么处理?
  • 企业转让销售配额怎么算
  • 非关联企业无偿拆借资金企业所得税
  • 福利费计提包括奖金吗
  • 怎么用苹果6splus
  • 劳务报酬计入综合所得吗
  • 总资产算不算负债
  • composer.json和composer.lock
  • php过滤emoji
  • 人工智能导论报告
  • 印花税按次按月
  • 八个与cpu相关的字符
  • 应扣未扣税款对纳税人的处理
  • u盘数据全部丢失
  • 详解php实现执行任务
  • 企业收到对外投资收益交所得税吗
  • css设置背景颜色透明
  • 企业所得税申报表模板
  • PHP+HTML+JavaScript+Css实现简单爬虫开发
  • vue预览word加水印
  • php编写登陆界面
  • 汽油增值税专用发票几个点
  • 没有发票能办临时牌照吗
  • 工资只计提没有发放需要申报个税吗
  • 房地产企业根据什么交增值税
  • mysql存储引擎的作用
  • 资产负债表其他应收款包括哪些内容
  • 帮员工购买意外险怎么记到分录
  • 个人所得税率怎么退
  • 劳动合同没有齐缝章
  • 在建工程的成本包括应交增值税吗
  • 金银首饰以旧换新所得税处理
  • 货物已经入库发货怎么办
  • 年平均资金占用额公式
  • 管理费用中的水电费怎么记账
  • 民办幼儿园如何生存
  • 年底未分配利润在贷方
  • 教育经费支出
  • sql只能查询数据,不能修改数据
  • MySql 5.6.35 winx64 安装详细教程
  • win7鼠标自己移动
  • centos 文件管理
  • archlinux 配置网络
  • win10如何禁用windows defender
  • 使用xshell连接虚拟机需要修改哪些配置
  • pc是什么软件
  • win10应用商店叫什么
  • linux软件列表
  • JQuery.Ajax()的data参数类型实例详解
  • linux中shell的作用
  • opengl光照算法
  • 基于python的推荐系统
  • jquery crud
  • 黑马程序员学费多少钱2022
  • 让ie运行js时提示允许阻止内容运行的解决方法
  • 安卓手机启用暴露通知
  • sdk官方网站
  • javascript基于什么的语言
  • 怎么做到开放
  • 纪检委是干什么工作的能管理税务管理局吗
  • 地源热泵有收费标准吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设