位置: IT常识 - 正文

yolov5 anchors 中 K-means聚类

编辑:rootadmin
yolov5 anchors 中 K-means聚类 anchors运行trains.py没有生成anchor原因程序kmeans改动(距离、k-means++)运行trains.py没有生成anchor原因

推荐整理分享yolov5 anchors 中 K-means聚类,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

yolov5运行后有一行 autoanchor:

一些教程的生成图如下

训练一开始会先计算Best Possible Recall (BPR),当BPR < 0.98时,再在kmean_anchors函数中进行 k 均值 和 遗传算法 更新 anchors 。

但是我的数据集BPR = 0.9997,所以没有生成新的anchors。 默认的预设anchors很匹配我的训练数据,anchors就不会在更改,就使用预设的。 改了聚类的欧氏距离为iou,和去掉遗传算法,都没有预设的效果好。

yolov5s.yaml anchor:

best.pt 的anchor查看一下和 s 一样

# #################查看模型 的 anchor #######################import torchfrom models.experimental import attempt_loadmodel = attempt_load('runs/train/exp_xxxxxxxxxxxx/weights/best.pt', map_location=torch.device('cpu'))m = model.module.model[-1] if hasattr(model, 'module') else model.model[-1]print(m.anchor_grid)

如果直接使用预设anchors: 训练时命令行添加–noautoanchor,表示不计算anchor,直接使用配置文件里的默认的anchor,不加该参数表示训练之前会自动计算。

程序yolov5 anchors 中 K-means聚类

train.py utils.autoanchor.py 当BPR < 0.98时,再在kmean_anchors函数中进行 k 均值 和 遗传算法 更新 anchors

如果就要看它生成anchor的结果,可以把0.98改为0.9999

kmeans改动(距离、k-means++)

用 kmean_anchors 进行聚类。yolov5中用了kmeans和遗传算法。源代码 Kmeans calculation 欧氏距离聚类和遗传算法。

作者默认使用的k-means方法是scipy包提供的,使用的是欧式距离。 博主改成了基于1-IOU(bboxes, anchors)距离的方法。

kmeans和kmeans++参考博客。k-means++算法,属于k-means算法的衍生,其主要解决的是k-means算法第一步,随机选择中心点的问题。

用聚类算法算出来的anchor并不一定比初始值即coco上的anchor要好,原因是目标检测大部分基于迁移学习,backbone网络的训练参数是基于coco上的anchor学习的,所以其实大部分情况用这个聚类效果并没有直接使用coco上的好!!而且聚类效果跟数据集的数量有很大关系,一两千张图片,聚类出来效果可能不会很好

autoanchor.py

# print(f'{prefix}Running kmeans for {n} anchors on {len(wh)} points...') # s = wh.std(0) # sigmas for whitening # k, dist = kmeans(wh / s, n, iter=30) # points, mean distance # assert len(k) == n, f'{prefix}ERROR: scipy.cluster.vq.kmeans requested {n} points but returned only {len(k)}' # k *= s k = k_means(wh, n)

新建 yolo_kmeans.py

import numpy as np# 这里IOU的概念更像是只是考虑anchor的长宽def wh_iou(wh1, wh2): # Returns the nxm IoU matrix. wh1 is nx2, wh2 is mx2 wh1 = wh1[:, None] # [N,1,2] wh2 = wh2[None] # [1,M,2] inter = np.minimum(wh1, wh2).prod(2) # [N,M] return inter / (wh1.prod(2) + wh2.prod(2) - inter) # iou = inter / (area1 + area2 - inter)# k-means聚类,且评价指标采用IOUdef k_means(boxes, k, dist=np.median, use_iou=True, use_pp=False): """ yolo k-means methods Args: boxes: 需要聚类的bboxes,bboxes为n*2包含w,h k: 簇数(聚成几类) dist: 更新簇坐标的方法(默认使用中位数,比均值效果略好) use_iou:是否使用IOU做为计算 use_pp:是否是同k-means++算法 """ box_number = boxes.shape[0] last_nearest = np.zeros((box_number,)) # 在所有的bboxes中随机挑选k个作为簇的中心 if not use_pp: clusters = boxes[np.random.choice(box_number, k, replace=False)] # k_means++计算初始值 else: clusters = calc_center(boxes, k) # print(clusters) while True: # 计算每个bboxes离每个簇的距离 1-IOU(bboxes, anchors) if use_iou: distances = 1 - wh_iou(boxes, clusters) else: distances = calc_distance(boxes, clusters) # 计算每个bboxes距离最近的簇中心 current_nearest = np.argmin(distances, axis=1) # 每个簇中元素不在发生变化说明以及聚类完毕 if (last_nearest == current_nearest).all(): break # clusters won't change for cluster in range(k): # 根据每个簇中的bboxes重新计算簇中心 clusters[cluster] = dist(boxes[current_nearest == cluster], axis=0) last_nearest = current_nearest return clusters# 计算单独一个点和一个中心的距离def single_distance(center, point): center_x, center_y = center[0] / 2, center[1] / 2 point_x, point_y = point[0] / 2, point[1] / 2 return np.sqrt((center_x - point_x) ** 2 + (center_y - point_y) ** 2)# 计算中心点和其他点直接的距离def calc_distance(boxes, clusters): """ :param obs: 所有的观测点 :param clusters: 中心点 :return:每个点对应中心点的距离 """ distances = [] for box in boxes: # center_x, center_y = x/2, y/2 distance = [] for center in clusters: # center_xc, cneter_yc = xc/2, yc/2 distance.append(single_distance(box, center)) distances.append(distance) return distances# k_means++计算中心坐标def calc_center(boxes, k): box_number = boxes.shape[0] # 随机选取第一个中心点 first_index = np.random.choice(box_number, size=1) clusters = boxes[first_index] # 计算每个样本距中心点的距离 dist_note = np.zeros(box_number) dist_note += np.inf for i in range(k): # 如果已经找够了聚类中心,则退出 if i + 1 == k: break # 计算当前中心点和其他点的距离 for j in range(box_number): j_dist = single_distance(boxes[j], clusters[i]) if j_dist < dist_note[j]: dist_note[j] = j_dist # 转换为概率 dist_p = dist_note / dist_note.sum() # 使用赌轮盘法选择下一个点 next_index = np.random.choice(box_number, 1, p=dist_p) next_center = boxes[next_index] clusters = np.vstack([clusters, next_center]) return clusters

还要多远才能进入你的心

还要多久才能和你接近

本文链接地址:https://www.jiuchutong.com/zhishi/295232.html 转载请保留说明!

上一篇:【Pytorch项目实战】之语义分割:U-Net、UNet++、U2Net(pytorch开源项目)

下一篇:如何配置openai的返回Stream数据并转发到h5页面按markdown格式流式输出(怎么配置opencv)

  • 2017年最新互联网10大免费推广方式,现在知道不算晚!(2017年互联网热词)

    2017年最新互联网10大免费推广方式,现在知道不算晚!(2017年互联网热词)

  • 你的努力是为了让你的选择更正确(你的努力是为了有更多的选择)

    你的努力是为了让你的选择更正确(你的努力是为了有更多的选择)

  • iqoo8pro怎么设置省电模式(iQOO8pro怎么设置指纹快捷微信支付)

    iqoo8pro怎么设置省电模式(iQOO8pro怎么设置指纹快捷微信支付)

  • 邮政怎么查一年前明细(邮政怎么查一年的明细)

    邮政怎么查一年前明细(邮政怎么查一年的明细)

  • word怎样限制每行字数(怎么限制编辑一篇word中的一段)

    word怎样限制每行字数(怎么限制编辑一篇word中的一段)

  • 华为40w快充有多快(华为40w快充多久充满mate30pro)

    华为40w快充有多快(华为40w快充多久充满mate30pro)

  • 微信收款交易限制什么原因(微信收款交易限制人脸识别解除)

    微信收款交易限制什么原因(微信收款交易限制人脸识别解除)

  • amd3600有核显吗(amd3600核显能玩lol吗)

    amd3600有核显吗(amd3600核显能玩lol吗)

  • 转转需要交保证金吗(转转买家需要交保证金吗)

    转转需要交保证金吗(转转买家需要交保证金吗)

  • 苹果id注销后手机里的东西还在吗(苹果ID注销后手机号还能用吗)

    苹果id注销后手机里的东西还在吗(苹果ID注销后手机号还能用吗)

  • 华为aicamra是什么型号(华为aicamera是什么型号的手机)

    华为aicamra是什么型号(华为aicamera是什么型号的手机)

  • 视频怎么拼到图片上(视频怎么拼图在一起)

    视频怎么拼到图片上(视频怎么拼图在一起)

  • 淘宝延长收货什么意思(淘宝延长收货什么意思 点了会怎么样?)

    淘宝延长收货什么意思(淘宝延长收货什么意思 点了会怎么样?)

  • qq好友怎么删除

    qq好友怎么删除

  • 华为mate30pro怎么关机(华为mate30pro怎么样,值得入手吗)

    华为mate30pro怎么关机(华为mate30pro怎么样,值得入手吗)

  • 华为怎么开启录屏权限(华为怎么开启录音权限)

    华为怎么开启录屏权限(华为怎么开启录音权限)

  • 苹果手机时间显示位置可以调整吗(苹果手机时间显示秒怎么设置)

    苹果手机时间显示位置可以调整吗(苹果手机时间显示秒怎么设置)

  • 微信单个表情怎么删除(微信单个表情怎么制作)

    微信单个表情怎么删除(微信单个表情怎么制作)

  • 小米9有没有耳机孔(小米9有没有耳机口)

    小米9有没有耳机孔(小米9有没有耳机口)

  • 常用的优化器合集(优化器总结)

    常用的优化器合集(优化器总结)

  • vue-cli创建vue项目详细步骤(vue-cli4创建项目)

    vue-cli创建vue项目详细步骤(vue-cli4创建项目)

  • 独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow,光年之外欲添新大将...(美团收购联联)

    独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow,光年之外欲添新大将...(美团收购联联)

  • 提成过高
  • 预付卡的发票
  • 光盘税收分类编码是多少
  • 建筑业属于货物行业吗
  • 专利年费是不是只能一项一项交
  • 计提跌价的存货卖出了
  • 税盘服务费抵税怎么做分录
  • 个人抬头发票可以抵税个人所得税吗
  • 以旧换新的会计处理规定
  • 银行质押贷款会查征信吗
  • 无形资产评估增值
  • 不是办税员可以去税局办事吗
  • 物业签订的合同
  • 税控盘锁死还能报税吗
  • 讲师费发票开票科目
  • 一般纳税人印花税减半征收吗
  • 中小企业货币资金内部控制案例
  • 融资租赁与经营租赁的相同点
  • 多交的增税怎么做账
  • 车不入库扣几分
  • 政府性基金预算收入包括
  • 出租固定资产收取租金
  • 怎么加入win11预览计划
  • win10如何设置声音
  • 腾讯手游助手玩不了金铲铲
  • 在windows 7中
  • vue中如何使用weboffice
  • 深度学习中模型计算量(FLOPs)和参数量(Params)的理解以及四种计算方法总结
  • php的递归
  • php 操作mysql
  • 好用的5款国产手机推荐
  • 开发成本怎么做分录
  • js去掉数组中的空字符串
  • 探索app下载
  • 参加《2022 中国开发者影响力盛典》我的 4 重收获!
  • 磁盘命令符
  • thinkphp框架怎么用
  • 企业的研发支出
  • 怎么调整以前年度
  • 印花税的缴税对象是
  • 进口形式发票能证明商品是进口的吗
  • 怎样计算负债率
  • 织梦添加文章如何修改高级参数
  • 企业取得政府奖励资金如何用
  • 织梦相关文章调用
  • 委托收款的含义
  • 有收入就要结转成本吗为什么
  • 小规模纳税人通行费可以抵扣吗
  • 什么时候贷主营业务成本
  • 给员工购买
  • 企业中间投入
  • 计提合同印花税怎么做账
  • 固定资产未转固属于什么问题
  • 土地契税税率计算公式
  • 事业单位的服务期
  • 小规模30万含专票吗
  • 天猫佣金是什么意思
  • 主营业务成本的增加在哪一方
  • 员工借支备用金属于现金流量的哪类
  • sql查询树形结构
  • mysql 5.7.28安装
  • sqlserver数据库和mysql区别
  • centos安装位置选择
  • 苹果手机
  • win8 应用商店
  • win7使用临时配置文件登录
  • 怎么处理人际关系
  • 如何解决android代码红线
  • 认识 认知
  • js鼠标滚动页面触发事件
  • jquery移动div到另一个div中
  • chrome调试js
  • js 引用类型
  • 朵朵舞百科
  • jquery weui
  • 喜大普奔含义
  • First class: UI design for Android
  • 国家税务局总局官网
  • 酒席发票
  • 代扣代缴企业所得税会计分录
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设