位置: IT常识 - 正文

基于yoloV7-pose添加任意关键点 + 多类别分类网络修改(yolov3实现)

编辑:rootadmin
基于yoloV7-pose添加任意关键点 + 多类别分类网络修改 一 修改思想

推荐整理分享基于yoloV7-pose添加任意关键点 + 多类别分类网络修改(yolov3实现),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov5训练出来参数box,yolov3 anchors设置,yolov3实现,yolov3教程,基于yolov4的,yolov教程,基于yolov4的,基于yolov4的,内容如对您有帮助,希望把文章链接给更多的朋友!

目前yoloV7已经发布有一段时间了,其中yoloV7有一个关键点检测的分支pose,是一个姿态关键点的检测算法,其中有给出的数据,大家可以下载运行起来。 由于实际项目需求,发现17个关键点是不能满足大家的需求的,这里我就稍作修改了一下,把关键点的数量修改为任意数量,并且添加目标检测多分类情况。

二 数据修改

这里我是以车牌的关键点进行举例修改,所有关键点的数量为4个。 修改的过程中需要做左右翻转,所以我的关键点翻转后,1和2交换,3和4交换,5和6交换,依次类推。

1 yaml文件修改

设置关键点数量,修改关键点数量为4

设置类别数量和类别标签

数据制作训练标签制作# -nfs-阿拉伯车牌字符-沙特阿拉伯卡口车牌-2-沙特阿拉伯卡口车牌-2-image1837.txt# data.txt 含义分别是: cls x y w h point1xpoint1ypoint2x point2y point3x point3y point4x point4y ...# 类别 目标中心点x 目标中心点y 目标宽w 目标高h 目标点1x坐标 目标点1y坐标 目标点2x坐标 目标点2y坐标 目标点3x坐标 目标点3y坐标 目标点4x坐标 目标点4y坐标 依次类推 0 0.5739299610894941 0.1724137931034483 0.3715953307392996 0.29064039408866993 0.38910505836575876 0.08374384236453201 0.7587548638132295 0.029556650246305417 0.7607003891050583 0.2660098522167488 0.39299610894941633 0.32019704433497537 2 0.5739299610894941 0.1724137931034483 0.3715953307392996 0.29064039408866993 0.38910505836575876 0.08374384236453201 0.7587548638132295 0.029556650246305417 0.7607003891050583 0.2660098522167488 0.39299610894941633 0.32019704433497537 0 0.5739299610894941 0.1724137931034483 0.3715953307392996 0.29064039408866993 0.38910505836575876 0.08374384236453201 0.7587548638132295 0.029556650246305417 0.7607003891050583 0.2660098522167488 0.39299610894941633 0.32019704433497537 训练文件train.txt 和val.txt 制作# train.txt./train/images/-nfs-阿拉伯车牌字符-沙特阿拉伯卡口车牌-2-沙特阿拉伯卡口车牌-2-image1837.jpeg./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 11-11-52屏幕截图.png./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 13-57-27屏幕截图.png./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 10-19-54屏幕截图.png./train/images/-nfs-阿拉伯车牌字符-外国车牌现场_20210519_1-外国车牌现场_20210519_1-e0d92b0990a1249388bc77bdfa8e43ed.jpg./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 13-51-28屏幕截图.png./train/images/-nfs-车牌字符-约旦车牌-videoplayback-videoplayback_13_1460.jpg./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 13-56-51屏幕截图.png./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 10-27-50屏幕截图.png数据读取修改

核心思想就是要把关键点的数量传入数据读取中,根据关键点数量进行数据读取操作。

datasets.py/LoadImagesAndLabels() 初始化修改

cache_labels() 方法 :数据读取修改

LoadImagesAndLabels()中__getitem__() 方法 :数据左右翻转修改

基于yoloV7-pose添加任意关键点 + 多类别分类网络修改(yolov3实现)

datasets.py/random_perspective() 方法

用到random_perspective()方法的地方记得都去添加一个关机键点数量参数。

三 网络结构修改1 model文件修改yolo.py 我们用到的是IKeypoint()方法,所以这里只修改这个方法,其他方法是一样的修改。 结构中主要是把分类数量和关机键点数量加入进去就ok了。 loss文件修改loss初始化类别数量和关机键数量 loss 计算中加入类别和关机键点计算

build_targets() 方法修改 添加关键点数量 四 训练代码修改1 train.py添加关机键点数量 读取数据加入关机键点数量 初始化loss 添加关键点数量和类别数量 画图添加关键点数量 2 test.py

读取数据添加关机键点数量

画图添加关机键点数量

3 general.py 中non_max_suppression()方法修改

4 plots.py 文件夹修改

主要是添加关机键点的数量

五 代码分享1 训练测试

关键点效果已经成功加上去了,并且也添加了多分类。

2 代码链接

代码地址(yolov7-pose_Npoint_Ncla):https://github.com/qinggangwu/yolov7-pose_Npoint_Ncla

本文链接地址:https://www.jiuchutong.com/zhishi/298725.html 转载请保留说明!

上一篇:3DResNet 学习记录(3d representation)

下一篇:python+neo4j构建基于知识图谱的电影知识智能问答系统(python 构建)

  • 我的常州怎么注册(我的常州怎么注册不了)

    我的常州怎么注册(我的常州怎么注册不了)

  • 淘宝助理怎么批量发布宝贝(淘宝助理怎么批量删除)

    淘宝助理怎么批量发布宝贝(淘宝助理怎么批量删除)

  • vivo手机指纹解锁在哪(vivo手机指纹解锁不显示)

    vivo手机指纹解锁在哪(vivo手机指纹解锁不显示)

  • qq资料卡怎么设置全屏背景(qq资料卡怎么设置动态视频)

    qq资料卡怎么设置全屏背景(qq资料卡怎么设置动态视频)

  • 华为手机可以录制屏幕视频吗(华为手机可以录屏吗)

    华为手机可以录制屏幕视频吗(华为手机可以录屏吗)

  • 酷狗连续包月可以第一个月就取消吗(酷狗连续包月可以买了之后马上关吗)

    酷狗连续包月可以第一个月就取消吗(酷狗连续包月可以买了之后马上关吗)

  • qq聊天记录不漫游是什么意思(qq聊天记录不漫游怎么恢复)

    qq聊天记录不漫游是什么意思(qq聊天记录不漫游怎么恢复)

  • 铃声音量怎么不能拉动(1手机铃声音量怎么设置不了)

    铃声音量怎么不能拉动(1手机铃声音量怎么设置不了)

  • 苏宁自营是什么意思(苏宁自营店是什么意思?)

    苏宁自营是什么意思(苏宁自营店是什么意思?)

  • ipad2017支持18w快充吗(ipad2017支持快充)

    ipad2017支持18w快充吗(ipad2017支持快充)

  • gputurbo是什么意思(gputurbo在哪)

    gputurbo是什么意思(gputurbo在哪)

  • 快手里黑名单移除还能找到吗(快手里黑名单移出去的人去哪里找回)

    快手里黑名单移除还能找到吗(快手里黑名单移出去的人去哪里找回)

  • 媒体音量调到最大还是小怎么回事(媒体音量调到最小)

    媒体音量调到最大还是小怎么回事(媒体音量调到最小)

  • 华为手机不息屏怎么设置(华为手机不灭屏的方法)

    华为手机不息屏怎么设置(华为手机不灭屏的方法)

  • 台式电脑不用音响怎么出声(台式电脑不用音响怎么有声音)

    台式电脑不用音响怎么出声(台式电脑不用音响怎么有声音)

  • word没保存能恢复吗(word如果没保存怎么找回)

    word没保存能恢复吗(word如果没保存怎么找回)

  • 苹果x绿屏闪烁怎么处理(苹果x绿屏闪烁后又好了)

    苹果x绿屏闪烁怎么处理(苹果x绿屏闪烁后又好了)

  • vivox23怎么设置微信美颜(vivox23怎么设置自动关机开机)

    vivox23怎么设置微信美颜(vivox23怎么设置自动关机开机)

  • 苹果xsmax和苹果11pro max的区别

    苹果xsmax和苹果11pro max的区别

  • 风筝守护只支持小米手机吗(风筝守护支持哪些手机品牌)

    风筝守护只支持小米手机吗(风筝守护支持哪些手机品牌)

  • ipad定位服务在哪里(ipad定位服务在哪里打开)

    ipad定位服务在哪里(ipad定位服务在哪里打开)

  • Code For Better 谷歌开发者之声——初识Web与谷歌,拉起兴趣之心。

    Code For Better 谷歌开发者之声——初识Web与谷歌,拉起兴趣之心。

  • Openpcdet训练自己的数据集(opencv怎么训练)

    Openpcdet训练自己的数据集(opencv怎么训练)

  • 对公账户要收手续费吗
  • 会计准则折旧年限规定最新
  • 财务如何审核合同支付条款风险
  • 居间费用超过3%剩余的怎样能拿到手
  • 公司的旅游费怎么处理
  • 企业支付投资者股利属于什么引起的财务活动
  • 合同违约金账务处理
  • 以前年度已付的现金
  • 稽查查补税款企业所得税
  • 受托加工物资如何做账
  • 附税分录怎么做?
  • 补贴与工资薪金一起发放,属于福利费,还是纳入工资薪金总额税前扣除?
  • 0申报逾期罚款
  • 餐饮行业采购流程图
  • 公司如何为员工缴纳社保
  • 退休返聘人员的劳动权益保护
  • 保税区内的货物交易
  • 非企业性单位包括哪些单位
  • 研发费用申报表汇算清缴怎么填
  • 出售土地印花税怎么计算
  • git pull远程
  • deskrun.exe是什么东西
  • windows 平台
  • 增值税发票销货清单哪里领
  • vue watch监听vuex数据
  • 为什么微信转账不成功
  • 塞巴斯蒂安电影 豆瓣
  • 栖息在树林中
  • 汇算清缴期结束后,税务机关发现企业
  • php2008
  • yolov4参数设置
  • 不仅仅是喜欢原唱
  • opencv模板匹配原理
  • php自加
  • 固定资产清理的借贷方向表示什么
  • 应收股利的明细科目
  • 兼职费用怎么入账报销
  • 免费学电脑网站
  • 房地产拆迁补偿协议
  • 航空公司可以开发票吗
  • 资产总额是指营业收入和营业支出吗
  • ms-sql-s
  • 混合销售的含义
  • 企业所得税季度申报表营业收入怎么填写
  • sql扩展
  • 小规模纳税人专票开1%还是3%
  • 办公装修费用多少
  • 在软件中的操作有哪些
  • 应收账款收不回来了应怎么做会计分录
  • 预缴的增值税及附加税怎么做账
  • 上年度多提财务费用
  • 融资租赁租金会计科目
  • 投资主体将其拥有的货币或产业资本
  • 二类银行卡是什么卡
  • 水利建设基金要预缴吗
  • 会计内帐外帐的区别在哪
  • 公司怎么建
  • sql查询从入门到实践
  • mysql5.7.17下载
  • Linux/Mac MySQL忘记密码怎么办
  • 苹果电脑邮箱添加163邮箱
  • 神舟hasee笔记本测评
  • win 驱动
  • 怎么在mac上看电视剧
  • linux w
  • Linux httpd(apache)启动失败 解决办法
  • 找回失窃的书本任务
  • 为了保证系统安全,必须为用户和角色设置密码
  • c/s模式的例子
  • 淘宝国际平台叫什么
  • jquery的实现原理
  • js数组洗牌
  • unity删除对象
  • javascript异步编程
  • js如何使用
  • jquery鼠标移入移出切换图片
  • 安卓中五种常见布局的特点
  • 湖南地税网上办税服务厅
  • 宁夏电子税务局官网登录入口首页
  • 税控盘怎么看收入
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设