位置: IT常识 - 正文

基于1DCNN(一维卷积神经网络)的目标识别(一维卷积padding)

编辑:rootadmin
基于1DCNN(一维卷积神经网络)的目标识别

推荐整理分享基于1DCNN(一维卷积神经网络)的目标识别(一维卷积padding),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:一维卷积神经网络原理,一维卷积模型,一维卷积模型,一维卷积计算公式,一维卷积模型,一维卷积计算公式,一维卷积padding,一维卷积计算公式,内容如对您有帮助,希望把文章链接给更多的朋友!

简介:研一已经结束,感觉动手能力太差,找了一篇优秀的博主的文章,然后进行学习,奈何

科研小白,代码经过各种查找,终于明白了原理。

在此先感谢博主"秋雨行舟",他还有B站对应的讲解,贼良心的一位博主!!

链接:https://blog.csdn.net/qq_38918049/article/details/124992113?spm=1001.2014.3001.5501

对博主中的代码做了稍许修改,添加了大量注释,以此篇博客记录学习过程中的收获。

数据集:凯斯西储实验室的轴承故障诊断(振动加速度采集的)和我的研究对象很很相似,都是一维时间序列的目标,所以拿来练手。

基于1DCNN(一维卷积神经网络)的目标识别(一维卷积padding)

平台:jupyter notebook,把每一行代码所表述的意思完全展示出来了,更加容易理解代码执行过程,相较于pyhcarm更加友好,对跑神经网络,因为能够直观的看到运行过程。

环境:win10,tensorflow2.1(感觉深度学习,版本可以不要太高,要不然很多不兼容,整着好麻烦,我就是从tensorflow版本2.5降到了2.1,目前为止用的还可以,可能以后还有升级,,,)。

代码介绍:从10个.mat文件中经过一系列数据处理(内容是真滴丰富)分为1500个(784,1)的训练集和750个(784,1)的验证集和测试集,搭建CNN模型(函数式)进行训练,通过测试集进行评估。

代码获取:可以从“秋雨行舟”博主上去找资源,也可以找我啊,我基本上把每行代码都注释了,也欢迎研究一维时间序列目标检测,目标识别的小伙伴一块组队学习啊!

目录

  一.数据预处理

1.1 从.mat文件中读取数据的字典

1.2划分训练集和测试集

1.3训练集,测试集打标签

1.4数据标准化并把测试集再分为测试集和验证集

           二.搭建1DCNN模型

2.1 数据处理

2.2 定义一个保存最佳模型的方法

2.3 搭建模型

2.4 编译模型

2.5训练模型并保存

2.6效果展示(损失,精确对比)

          三.评估模型

 四.混淆矩阵

 五.总结


一.数据预处理1.1 从.mat文件中读取数据的字典# 定义函数把原始数据打包成字典def capture(original_path): files = {} for i in filenames: file_path = os.path.join(d_path, i) file = loadmat(file_path) # loadmat()加载.mat函数 file_keys = file.keys() # 获取加载后的.mat文件的键值,也就是‘12k_Drive_End_B007_0_118.mat’这种 for key in file_keys: # 获取所有文件中结构体中含有字符为DE的数据,并将数据写入字典中 if 'DE' in key: # 这个地方‘DE’在这组数据中都有‘Drive_End’所以相当于遍历了,如果是凯斯西储实验室的其他几组数据,要换一下 files[i] = file[key].ravel() # 转换为一维数组 return filesdata = capture(original_path=d_path)data1.2划分训练集和测试集# 定义参数rate = [0.5, 0.25, 0.25] # 训练集,测试集,验证集划分比例(测试集和验证集这个步骤在一块)number = 300 # 每类样本的数量length = 784 # 样本长度# 定义划分训练集和测试集的函数def slice_enc(data, slice_rate=rate[1] + rate[2]): keys = data.keys() Train_Samples = {} Test_Samples = {} for i in keys: slice_data = data[i] # 遍历到.mat字典的每个值,也就是data的array部分(用键去遍历) all_lenght = len(slice_data) # end_index = int(all_lenght * (1 - slice_rate)) # 感觉这个被山区的注释这一行才对啊,能理解 # 下面是每个.mat数据中的value部分拿出一半做训练集的一部分 samp_train = int(number * (1 - slice_rate)) # 1000(1-0.3) # 不明白这个地方的备注(1000(1-0.3)) 不应该是300*(1-0.5)? Train_sample = [] Test_Sample = [] # 抓取训练数据放到训练集中 for j in range(samp_train): # (遍历150次) # 每个.mat数据的训练集的长度 sample = slice_data[j*150: j*150 + length] # (0:784) 也就是每个训练数据为(784,1) Train_sample.append(sample) # 把每个做训练的部分放到训练集中 # 抓取测试数据 for h in range(number - samp_train): # (遍历150次) sample = slice_data[samp_train*150 + length + h*150: samp_train*150 + length + h*150 + length] # 每条测试数据为(784,1) Test_Sample.append(sample) # 把每个做测试的部分放到测试集中 # 遍历的每条数据把划分的训练数据,测试数据放到对应集合中 Train_Samples[i] = Train_sample Test_Samples[i] = Test_Sample return Train_Samples, Test_Samplestrain,test = slice_enc(data)# 每个.mat数据划分为多少个训练字段,# 所以总共10个原始数据,每个原始数据划分为150个训练字段for i in train.keys(): a = train[i] len(a) print(len(a))[out]:1501501501501501501501501501501.3训练集,测试集打标签# 定义添加标签的函数def add_labels(train_test): X =[] Y = [] label = 0 for i in filenames: # 遍历每个.mat数据,(i=0,第一个mat数据中的150条训练数据的标签设为0) x = train_test[i] X += x lenx = len(x) Y += [label] *lenx label +=1 return X,Y# 为训练集制作标签Train_X ,Train_Y = add_labels(train)# Train_X,Train_Y中1500条训练数据,每150条训练数据对应一个标签,有0-9个10个不同的标签类型1.4数据标准化并把测试集再分为测试集和验证集# 定义标准化函数def scalar_stand(Train_X, Test_X): # 用训练集标准差标准化训练集以及测试集 data_all = np.vstack((Train_X, Test_X)) # 数据降为一维平铺 scalar = preprocessing.StandardScaler().fit(data_all) # sklearn.preprcoessing包下的数据标准化函数 Train_X = scalar.transform(Train_X) #调用 .transform函数对数据进行标准化 Test_X = scalar.transform(Test_X) return Train_X, Test_X# 测试集再分为测试集和验证集(比例1:1)def valid_test_slice(Test_X, Test_Y): test_size = rate[2] / (rate[1] + rate[2]) # n_splits=1,将其分成一组也就是两部分,test_size每组的比例 ss = StratifiedShuffleSplit(n_splits=1, test_size=test_size) # 拿出一半做测试集,一半做验证集(test_size=0.5) Test_Y = np.asarray(Test_Y, dtype=np.int32) # 更新Test_Y for train_index, test_index in ss.split(Test_X, Test_Y): X_valid, X_test = Test_X[train_index], Test_X[test_index] # 把验证集和训练集对应 Y_valid, Y_test = Test_Y[train_index], Test_Y[test_index] return X_valid, Y_valid, X_test, Y_testnormal = True # 是否标准化# 执行标准化if normal: Train_X, Test_X = scalar_stand(Train_X, Test_X)Train_X = np.asarray(Train_X) # 经过方法np.asarray(x)得到最新的xTest_X = np.asarray(Test_X)# 把测试集拿出一半做验证集Valid_X, Valid_Y, Test_X, Test_Y = valid_test_slice(Test_X, Test_Y)二.搭建1DCNN模型2.1 数据处理2.2 定义一个保存最佳模型的方法# 保存最佳模型class CustomModelCheckpoint(keras.callbacks.Callback):# 使用回调函数来观察训练过程中网络内部的状态和统计信息r然后选取最佳的进行保存 def __init__(self, model, path): # (自定义初始化) self.model = model self.path = path self.best_loss = np.inf # np.inf 表示+∞,是没有确切的数值的,类型为浮点型 自定义最佳损失数值 def on_epoch_end(self, epoch, logs=None): # on_epoch_end(self, epoch, logs=None)在每次迭代训练结束时调用。在不同的方法中这个logs有不同的键值 val_loss = logs['val_loss'] # logs是一个字典对象directory; if val_loss < self.best_loss: print("\nValidation loss decreased from {} to {}, saving model".format(self.best_loss, val_loss)) self.model.save_weights(self.path, overwrite=True) # overwrite=True覆盖原有文件 # 此处为保存权重没有保存整个模型 self.best_loss = val_loss2.3 搭建模型# 搭建模型框架(函数式API方法)def mymodel(): inputs = keras.Input(shape=(Train_X.shape[1],Train_X.shape[2]))# ([1500, 784, 1])把【784,1】传入输入层,没看数据处理时,还不知道为啥这样传 h1= layers.Conv1D(filters=8,kernel_size=3,strides=1,padding='same',activation='relu')(inputs) h1 = layers.MaxPool1D(pool_size=2,strides=2,padding='same')(h1) h2 = layers.Conv1D(filters=16,kernel_size=3,strides=1,padding='same')(h1) h2 = layers.MaxPool1D(pool_size=2,strides=2,padding='same')(h2) h3 = layers.Flatten()(h2) # 扁平层,方便全连接层传入数据 h4 = layers.Dropout(0.6)(h3) # Droupt层舍弃百分之60的神经元 h5 = layers.Dense(32,activation='relu')(h4) # 全连接层,输出为32 outputs = layers.Dense(10,activation='softmax')(h5) # 再来个全连接层,分类结果为10种(9种故障类型,1种正常的) # 不要出现中文,,,,,,血泪教训,最开始把1DCNN模型,有模型二字,导致编译出错,一顿爆改! deep_model = keras.Model(inputs,outputs,name = '1DCNN') # 整合每个层,搭建1DCNN模型成功 return deep_model

2.4 编译模型# 编译模型,(优化器:Adam,损失函数:sparse_categorical_crossentropy)model.compile( optimizer=keras.optimizers.Adam(), loss='sparse_categorical_crossentropy', metrics=['accuracy'])2.5训练模型并保存history = model.fit(Train_X, Train_Y, batch_size=256, epochs=50, verbose=1, validation_data=(Valid_X, Valid_Y), callbacks=[CustomModelCheckpoint( model, r'mybestcnn.h5')]) # verbose=1带进度条的输出日志信息

 

2.6效果展示(损失,精确对比)

三.评估模型四.混淆矩阵

五.总结

第一次完整的看完一篇代码,权当入门起步!,因为版本和环境的问题,把代码从pycharm转到jupyter,着实费了了我好大力,一行一行代码去百度,最后才完成,遇到很多困难,但解决掉BUG的时候真滴酸爽!!!!!!!!

本文链接地址:https://www.jiuchutong.com/zhishi/296003.html 转载请保留说明!

上一篇:nvm安装(windows)(nvme安装win10教程)

下一篇:〖大前端 - 基础入门三大核心之JS篇⑰〗- JavaScript的流程控制语句「while循环语句」(大前端需要掌握什么技能)

  • 劳务派遣公司差额征税的账务处理
  • 增值税的计税金额
  • 未能确认收入的原因
  • 注销税务注意事项
  • 民非组织捐赠收入免税
  • 外商投资企业清算报告
  • 可控费用包括工资吗
  • 专项土地补偿款怎么入账?
  • 发票已抵扣是什么意思
  • 收到借款利息怎么做会计分录
  • 广东省电子税务局app下载
  • 差旅补助是否并入工资
  • 个体户开普票要交企业所得税吗
  • 哪些金融资产不计提减值
  • 如何根据原始凭证填制记账凭证
  • 管理费用怎么记忆
  • 企业所得税怎么征收几个点
  • 取得免税农产品进项税转出
  • 认缴出资未缴纳公司可以减资吗
  • 费用摊销的常用方法有哪些
  • 小企业短期投资的核算应设置的会计科目有
  • 什么是增值税
  • 非公党费返还
  • win10两个屏幕两个桌面
  • 只有发票没有银行客户专用回单是啥意思
  • 出差人员餐费,进项可以抵扣吗
  • win11 insider preview怎么升级正式版
  • 笔记本如何进行截图
  • 2020 php 薪资
  • fodhelper.exe是什么程序
  • 马齿笕对什么病最有效?
  • 解决问题
  • nginx静态文件服务器
  • Chat GPT实用案例——VUE+Chat GPT实现聊天功能教程
  • 企业之间拆借资金
  • 企业财务管理内部控制问题与应对策略
  • 老年人经常便秘怎么办
  • 苍鹭一生可以活多久
  • php缓存文件并自动清理
  • php缓存机制有哪些
  • php引用文件的方法
  • 红嘴牛文鸟图片
  • 暂估原材料的数量怎么算
  • 工程完工后的质量抽检不合格怎么办
  • 新版python
  • 海关缴款书当月能查到吗
  • 企业研发支出的最佳占比
  • mysql 5.7特性
  • 企业增值税抵扣包括哪些内容
  • 企业销售商品满足收入确认条件时,应当
  • 那怎么才能恢复
  • 火车票可以抵扣进项吗
  • 内帐收入怎么确定
  • 免抵退税和留抵退税计算题
  • 如何将港币兑换成人民币
  • 进项税加计抵减的分录怎么做?
  • 外出经营预交企业所得税税率
  • 怎样理解
  • 融资租入固定资产属于本企业资产
  • 会计账本是一年一本吗
  • mysql忘记了初始密码
  • 详解MySQL的limit用法和分页查询语句的性能分析
  • 装双win7系统怎么设置
  • linux里find命令
  • winxp系统和win7系统有什么区别
  • config是什么文件夹
  • win7系统无法修复怎么办
  • windows10新功能
  • win7运行老游戏方法
  • win7的记事本在哪里打开
  • 卸载安装软件
  • unity hover
  • Python selenium 三种等待方式详解(必会)
  • javascript面向对象 第三方类库
  • 蓝牙模块手机程序
  • 国家税务总局2018年61号公告
  • 土地储备中心出让公告
  • 防伪开票系统操作流程
  • 允许抵扣和不允许抵扣进项税额的发票种类
  • 云南省国家税务局APP
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设