位置: IT常识 - 正文

基于yoloV7添加关键点训练记录(yolov5 教程)

编辑:rootadmin
基于yoloV7添加关键点训练记录 一 、前言

推荐整理分享基于yoloV7添加关键点训练记录(yolov5 教程),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov4如何改进,yolov3怎么改进,yolov3使用教程,yolov3怎么用,yolov4 教程,yolov教程,yolov教程,yolov教程,内容如对您有帮助,希望把文章链接给更多的朋友!

yoloV7已经开源有一段时间了,近期已经基于yoloV7-pose的关键点算法进行了研究和修改。目前已经将该工程修改为,多分类+任意数量关键点:修改详细请看博客:基于yoloV7-pose添加任意关键点 + 多类别分类网络修改,修改代码已经开源:github地址,如果对大家有帮助也希望可以帮忙点点☆☆。 好的,接下来我们就开始训练模型。

二 、 数据准备2.1 数据介绍。

很多小伙伴有点不知道这些关键点怎么设置,我简单说一下逻辑,一般是检测框+关键点的形式,也就是说关键点是伴随框的,首先是希望box框可以收敛,然后再是点的收敛,所以框是必须的,然后点是非必须的,所有有些框可以不需要设置关键点,这里大家可以将关键点的值设置为-1就行, 这种关键点的标记工具可以选择labelme,对目标进行不规则四边形标记。 标记完成后图像可视化应该是这样的: 其中 第一个点是:绿色;第二个点是:蓝色;第三个点是:红色;第四个点是:白色。点的顺序是否需要有标准,我个人觉得是需要的,部分任务可能不需要,但目前我发现都是需要注意点的顺序的。 标记完成的内容,依次转化成txt文档:

# -nfs-阿拉伯车牌字符-沙特阿拉伯卡口车牌-2-沙特阿拉伯卡口车牌-2-image1837.txt# data.txt 含义分别是: cls x y w h point1xpoint1ypoint2x point2y point3x point3y point4x point4y ...# 类别 目标中心点x 目标中心点y 目标宽w 目标高h 目标点1x坐标 目标点1y坐标 目标点2x坐标 目标点2y坐标 目标点3x坐标 目标点3y坐标 目标点4x坐标 目标点4y坐标 依次类推 0 0.5739299610894941 0.1724137931034483 0.3715953307392996 0.29064039408866993 0.38910505836575876 0.08374384236453201 0.7587548638132295 0.029556650246305417 0.7607003891050583 0.2660098522167488 0.39299610894941633 0.32019704433497537 2 0.5739299610894941 0.1724137931034483 0.3715953307392996 0.29064039408866993 0.38910505836575876 0.08374384236453201 0.7587548638132295 0.029556650246305417 0.7607003891050583 0.2660098522167488 0.39299610894941633 0.32019704433497537 0 0.5739299610894941 0.1724137931034483 0.3715953307392996 0.29064039408866993 0.38910505836575876 0.08374384236453201 0.7587548638132295 0.029556650246305417 0.7607003891050583 0.2660098522167488 0.39299610894941633 0.32019704433497537

注意: 第1个值:类别索引,如果是单类别,这里值都为0 第2个值:目标框的中心点坐标x值, 第3个值:目标框的中心点坐标y值, 第4个值:目标框的宽度w, 第5个值:目标框的高度h, 第6个值:第1个关键点的x坐标,如果该关键点省去,设置坐标为-1 第7个值:第1个关键点的y坐标,如果该关键点省去,设置坐标为-1 第8个值:第2个关键点的x坐标,如果该关键点省去,设置坐标为-1 第9个值:第2个关键点的y坐标,如果该关键点省去,设置坐标为-1 第10个值:第3个关键点的x坐标,如果该关键点省去,设置坐标为-1 第11个值:第3个关键点的y坐标,如果该关键点省去,设置坐标为-1 第12个值:第4个关键点的x坐标,如果该关键点省去,设置坐标为-1 第13个值:第4个关键点的y坐标,如果该关键点省去,设置坐标为-1 … 后面依次是关键点的坐标值

2.1 修改数据yaml文件:

这里是读取数据的txt文档,所以传入图片路径txt文件即可,其中txt文档书写如下:

# train.txt./train/images/-nfs-阿拉伯车牌字符-沙特阿拉伯卡口车牌-2-沙特阿拉伯卡口车牌-2-image1837.jpeg./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 11-11-52屏幕截图.png./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 13-57-27屏幕截图.png./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 10-19-54屏幕截图.png./train/images/-nfs-阿拉伯车牌字符-外国车牌现场_20210519_1-外国车牌现场_20210519_1-e0d92b0990a1249388bc77bdfa8e43ed.jpg./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 13-51-28屏幕截图.png./train/images/-nfs-车牌字符-约旦车牌-videoplayback-videoplayback_13_1460.jpg./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 13-56-51屏幕截图.png./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 10-27-50屏幕截图.png

这里读取数据是 : txt前面的作为根目录,加上txt文档里面的路径, 所以图片的完整路径是这样存放的:

# txt前面的作为根目录,加上txt文档里面的路径,# 所以图片的完整路径是这样存放的: /media/wqg/3e165c12-9862-4867-b333-fbf93befd928/home/wqg/data/官网数据/PLATE/train/images/-nfs-阿拉伯车牌字符-沙特阿拉伯卡口车牌-2-沙特阿拉伯卡口车牌-2-image1837.jpeg基于yoloV7添加关键点训练记录(yolov5 教程)

传入txt文档即可开始训练了。记得修改nc的类别数量和对应的名称

三 、开始训练

训练代码使用的是:./yolov7-pose_Npoint_Ncla/train_Ncla_nPoint.py

3.1 修改模型结构yaml文件

设置关键点的数量,默认是以4个关键点进行训练,类别数量默认是读取数据文件中的nc值。

3.2 数据准备好了就可以开始训练了

分别传入预训练权重,模型配置文件,修改好的数据文件,hyp文件,训练批次,训练尺寸等等。

权重链接:百度云链接 : https://pan.baidu.com/s/1izQzp7G5-tncRKtMTEyrUA 提取码: t82o。建议: hyp文件中大家不要开上下翻转和左右翻转,会有可能导致关键点混乱。左右翻转是按照,1和2,3和4,5和6,7和8进行交换,上下翻转没有写翻转逻辑,建议不用,用的话需要自己修改代码。

训练开始,大家可以看到图像的每个关键点都是正确的:

四 、 训练结果

这里我只是训练了100个eopch,数据也只是添加了500多张,

可以使用 tensorboard查看训练日志

训练推理结果:

推理代码:./yolov7-pose_Npoint_Ncla/detect.py

五、常见问题(粉丝问题)数据增强部分索引错误

关键点的数量建议是偶数个,如果是基数个,需要改一下代码,或者去掉左右翻转和上下翻转。
本文链接地址:https://www.jiuchutong.com/zhishi/297604.html 转载请保留说明!

上一篇:梯度下降算法(Gradient descent)(梯度下降算法的正确顺序是)

下一篇:opencv训练自己的模型,实现特定物体的识别(opencv训练模型教程)

  • 声卡的主要功能是啥(声卡的主要功能是什么选择题)

    声卡的主要功能是啥(声卡的主要功能是什么选择题)

  • 手机主板烧了照片恢复(手机主板烧了还能把手机里的东西倒出来吗)

    手机主板烧了照片恢复(手机主板烧了还能把手机里的东西倒出来吗)

  • qq群的语音聊天限制人数吗(qq群语音聊天限制人数吗)

    qq群的语音聊天限制人数吗(qq群语音聊天限制人数吗)

  • 云客赞是啥平台(云客赞是真的吗)

    云客赞是啥平台(云客赞是真的吗)

  • WPS表格打开不停向右滚动(wps表格打开不停向右滚动怎么办)

    WPS表格打开不停向右滚动(wps表格打开不停向右滚动怎么办)

  • 戴尔电脑突然关不了机(戴尔电脑自动关机后开不了机怎么办)

    戴尔电脑突然关不了机(戴尔电脑自动关机后开不了机怎么办)

  • 手机触屏失灵怎么办(手机触屏失灵怎么重启手机)

    手机触屏失灵怎么办(手机触屏失灵怎么重启手机)

  • 微软账户和本地账户有什么区别(微软账户和本地账户合二为一了)

    微软账户和本地账户有什么区别(微软账户和本地账户合二为一了)

  • 双声道和单声道的区别(双声道和单声道有什么区别)

    双声道和单声道的区别(双声道和单声道有什么区别)

  • ipad蓝牙一直在搜索中(ipad蓝牙一直在转圈圈)

    ipad蓝牙一直在搜索中(ipad蓝牙一直在转圈圈)

  • 微信新上线的表情怎么更新(新版微信表)

    微信新上线的表情怎么更新(新版微信表)

  • 喜马拉雅播放失败稍后重试(喜马拉雅播放失败的原因)

    喜马拉雅播放失败稍后重试(喜马拉雅播放失败的原因)

  • 陌陌关注多久可以语音视频(陌陌关注多久可以发语音)

    陌陌关注多久可以语音视频(陌陌关注多久可以发语音)

  • 反向选择快捷键(ps蒙版反向选择快捷键)

    反向选择快捷键(ps蒙版反向选择快捷键)

  • 微信封号几次永久封号(微信封号有几次机会)

    微信封号几次永久封号(微信封号有几次机会)

  • 手机摔了一下黑屏了怎么办(手机摔了一下黑屏了但是能震动)

    手机摔了一下黑屏了怎么办(手机摔了一下黑屏了但是能震动)

  • qq怎么打开礼物收益(QQ怎么打开礼物背包)

    qq怎么打开礼物收益(QQ怎么打开礼物背包)

  • vue怎么调节照片时间(vue怎么让照片放慢一点)

    vue怎么调节照片时间(vue怎么让照片放慢一点)

  • 苹果无线充电怎么用(苹果无线充电怎么看电量)

    苹果无线充电怎么用(苹果无线充电怎么看电量)

  • 小米手机怎么备份数据(小米手机怎么备份微信数据)

    小米手机怎么备份数据(小米手机怎么备份微信数据)

  • 数字证书包括哪些内容(数字证书有三种类型)

    数字证书包括哪些内容(数字证书有三种类型)

  • 华为手机设置里的通用在哪里(华为手机设置里找不到开发人员选项)

    华为手机设置里的通用在哪里(华为手机设置里找不到开发人员选项)

  • 拼多多签到怎么没有招财猫(拼多多签到怎么放到桌面)

    拼多多签到怎么没有招财猫(拼多多签到怎么放到桌面)

  • 微信里的视频怎么保存到相册(微信里的视频怎么做成抖音)

    微信里的视频怎么保存到相册(微信里的视频怎么做成抖音)

  • 苹果手机授权信任在哪里(苹果手机授权信任管理在哪设置)

    苹果手机授权信任在哪里(苹果手机授权信任管理在哪设置)

  • qq怎么设闺蜜空间(在qq怎么设置闺蜜空间)

    qq怎么设闺蜜空间(在qq怎么设置闺蜜空间)

  • epson打印机怎么安装(epson打印机怎么换色带)

    epson打印机怎么安装(epson打印机怎么换色带)

  • 手把手教你win7系统安装配置IIS服务(手把手教你win7换主板不重装系统的方法)

    手把手教你win7系统安装配置IIS服务(手把手教你win7换主板不重装系统的方法)

  • 帝国cms好用吗(帝国cms使用手册)

    帝国cms好用吗(帝国cms使用手册)

  • 印花税的会计分录有哪些
  • 营业净利率和总资产净利率的区别
  • 小企业会计准则2023电子版
  • 金融资产减值准备可以转回吗
  • 车位出售时要交什么税
  • 房地产税和物业税
  • 其他货币资金存出投资款什么时候用
  • 无形资产土地需要折旧吗
  • 股权转让所得应纳税所得额
  • 外购烟丝消费税是多少
  • 建筑行业劳务费开发票可以开工程款吗?
  • 互联网税务行动计划五大板块
  • 税法关于印花税的规定
  • 预缴企业所得税怎么算
  • 计提水电费是什么凭证
  • 仪器购买税率
  • 生产成本的计算公式是什么
  • 上月计提费用下月一定要冲回吗
  • 企业微信api错误码
  • 笔记本电脑如何恢复出厂系统
  • mac环境搭建
  • linux runit
  • phpget方法
  • 其他业务收入跨年调整
  • linux0.11编译
  • 个税借方的含义
  • 劳务派遣差额征税的账务处理实例
  • 1000左右打印机
  • 跨月红字发票开错了可以撤销吗
  • SQL Server 2008中SQL之WaitFor使用介绍
  • 小规模纳税人销售额超过500万
  • 新会计准则物业公司计提应收账款分录
  • 制造企业预提短期借款利息的会计科目处理
  • 购买服务费用
  • 收到退回的以前的快递
  • 赊销应收款余额怎么算
  • 财付通支付的优缺点
  • 原材料用于在建工程要进项转出吗
  • 公司注销时财务报表要注意什么
  • 在建工程转固定资产凭证附件
  • 农产品投入产出法怎么计算
  • 百旺开发票清单
  • 收取履约保证金的作用
  • 收入可以直接转成本吗?
  • 个体工商户记账报税教程
  • 年末本年利润怎么转到未分配利润
  • 会计一般月初忙几天
  • centos6.9安装教程详细
  • ubuntu20.04 u盘
  • ubuntu系统中文
  • wlanplus是什么软件
  • wweb32.exe - wweb32是什么进程
  • archlinux安装教程2023 无线网络
  • win7 mysql
  • centos查询所有用户
  • profiler.exe - profiler是什么进程 有什么用
  • win7系统如何关闭更新系统
  • netddeclnt.exe - netddeclnt是什么进程 有什么用
  • win8怎么卸载应用程序
  • win8如何更改默认存储位置
  • Windows8和Windows8 RT版的区别介绍
  • shell在linux
  • ftql
  • excel实现多选
  • ext.grid.panel
  • linux防火墙开启80端口视频
  • python怎么编程
  • 如何用python进行数据处理
  • android edittext被系统键盘遮挡
  • shell 四则运算
  • jquery.multiselect多选下拉框实现代码
  • 迄今最好的Http请求框架
  • JavaScript的RequireJS库入门指南
  • unity3d碰撞检测源码
  • python中按下某个按键
  • python 元类的作用
  • 税务工作创新
  • 江苏税务个人所得税app下载
  • 个体非正常户怎么解除
  • 有限合伙企业怎么交税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设