位置: IT常识 - 正文

目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则)

编辑:rootadmin
目标检测--边框回归损失函数SIoU原理详解及代码实现 边框回归损失函数1. SIoU1.1 原理1.2 代码实现1. SIoU1.1 原理

推荐整理分享目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:目标检测边框回归,目标检测边界框,目标检测用什么框架,目标检测斜框,目标检测斜框,目标检测画框,目标检测边框回归,目标检测的框是怎么出来的,内容如对您有帮助,希望把文章链接给更多的朋友!

有关IoU损失函数,如(GIoU, DIoU, CIoU)没有考虑到真实框与预测框框之间的方向,导致收敛速度较慢,对此SIoU引入真实框和预测框之间的向量角度,重新定义相关损失函数,具体包含四个部分: (1)角度损失(Angle cost),定义如下 Λ=1−2∗sin⁡2(arcsin⁡(chσ)−π4)=cos⁡(2∗(arcsin⁡(chσ)−π4))\Lambda = 1-2*\sin^2(\arcsin(\frac{c_h}{\sigma}) - \frac{\pi}{4})=\cos(2*(\arcsin(\frac{c_h}{\sigma}) - \frac{\pi}{4}))Λ=1−2∗sin2(arcsin(σch​​)−4π​)=cos(2∗(arcsin(σch​​)−4π​)) 其中chc_hch​为真实框和预测框中心点的高度差,σ\sigmaσ为真实框和预测框中心点的距离,事实上arcsin⁡(chσ)\arcsin (\frac{c_h}{\sigma})arcsin(σch​​)等于角度α\alphaα chσ=sin⁡(α)\frac{c_h}{\sigma}=\sin(\alpha)σch​​=sin(α) σ=(bcxgt−bcx)2+(bcygt−bcy)2\sigma = \sqrt{(b_{c_x}^{gt}-b_{c_x})^2+(b_{c_y}^{gt}-b_{c_y})^2}σ=(bcx​gt​−bcx​​)2+(bcy​gt​−bcy​​)2​ ch=max⁡(bcygt,bcy)−min⁡(bcygt,bcy)c_h = \max(b_{c_y}^{gt}, b_{c_y}) - \min(b_{c_y}^{gt}, b_{c_y})ch​=max(bcy​gt​,bcy​​)−min(bcy​gt​,bcy​​)

目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则)

(bcxgt,bcygt)(b_{c_x}^{gt}, b_{c_y}^{gt})(bcx​gt​,bcy​gt​)为真实框中心坐标(bcx,bcy)(b_{c_x}, b_{c_y})(bcx​​,bcy​​)为预测框中心坐标,可以注意到当α\alphaα为π2\frac{\pi}{2}2π​或0时,角度损失为0,在训练过程中若α<π4\alpha < \frac{\pi}{4}α<4π​,则最小化α\alphaα,否则最小化β\betaβ

(2)距离损失(Distance cost),定义如下: Δ=∑t=x,y(1−e−γρt)=2−e−γρx−e−γρy\Delta = \sum_{t=x,y}(1-e^{-\gamma\rho_t})=2-e^{-\gamma\rho_x}-e^{-\gamma\rho_y}Δ=t=x,y∑​(1−e−γρt​)=2−e−γρx​−e−γρy​ 其中: ρx=(bcxgt−bcxcw)2,ρy=(bcygt−bcych)2γ=2−Λ\rho_x = (\frac{b_{c_x}^{gt} - b_{c_x}}{c_w})^2, \quad \rho_y= (\frac{b_{c_y}^{gt} - b_{c_y}}{c_h})^2 \quad \gamma = 2 - \Lambdaρx​=(cw​bcx​gt​−bcx​​​)2,ρy​=(ch​bcy​gt​−bcy​​​)2γ=2−Λ 注意:这里的(cw,ch)(c_w, c_h)(cw​,ch​)为真实框和预测框最小外接矩形的宽和高

(3)形状损失(Shape cost),定义如下: Ω=∑t=w,h(1−e−wt)θ=(1−e−ww)θ+(1−e−wh)θ\Omega = \sum_{t=w, h}(1-e^{-w_t})^\theta=(1-e^{-w_w})^\theta+(1-e^{-w_h})^\thetaΩ=t=w,h∑​(1−e−wt​)θ=(1−e−ww​)θ+(1−e−wh​)θ 其中: ww=∣w−wgt∣max⁡(w,wgt),wh=∣h−hgt∣max⁡(h,hgt)w_w=\frac{|w-w^{gt}|}{\max(w, w^{gt})}, \quad w_h=\frac{|h-h^{gt}|}{\max(h, h^{gt})}ww​=max(w,wgt)∣w−wgt∣​,wh​=max(h,hgt)∣h−hgt∣​ (w,h)(w, h)(w,h)和(wgt,hgt)(w^{gt}, h^{gt})(wgt,hgt)分别为预测框和真实框的宽和高,θ\thetaθ控制对形状损失的关注程度,为了避免过于关注形状损失而降低对预测框的移动,作者使用遗传算法计算出θ\thetaθ接近4,因此作者定于θ\thetaθ参数范围为[2, 6]

(4)IoU损失(IoU cost) IoU=交集A并集BIoU=\frac{交集A}{并集B}IoU=并集B交集A​

综上所诉,最终SIoU损失函数定义如下: LossSIoU=1−IoU+Δ+Ω2Loss_{SIoU}=1-IoU+\frac{\Delta + \Omega}{2}LossSIoU​=1−IoU+2Δ+Ω​

1.2 代码实现

有关SIoU得代码实现如下(来源美团yolov6):

elif self.iou_type == 'siou':# SIoU Loss https://arxiv.org/pdf/2205.12740.pdf'''预测框和真实框坐标形式为xyxy,即左下右上角坐标或左上右下角坐标'''s_cw = (b2_x1 + b2_x2 - b1_x1 - b1_x2) * 0.5 #真实框和预测框中心点的宽度差s_ch = (b2_y1 + b2_y2 - b1_y1 - b1_y2) * 0.5 #真实框和预测框中心点的高度差sigma = torch.pow(s_cw ** 2 + s_ch ** 2, 0.5) #真实框和预测框中心点的距离sin_alpha_1 = torch.abs(s_cw) / sigma #真实框和预测框中心点的夹角βsin_alpha_2 = torch.abs(s_ch) / sigma #真实框和预测框中心点的夹角αthreshold = pow(2, 0.5) / 2 #夹角阈值sin_alpha = torch.where(sin_alpha_1 > threshold, sin_alpha_2, sin_alpha_1) #α大于45°则考虑优化β,否则优化αangle_cost = torch.cos(torch.arcsin(sin_alpha) * 2 - math.pi / 2) #角度损失rho_x = (s_cw / cw) ** 2 rho_y = (s_ch / ch) ** 2gamma = angle_cost - 2distance_cost = 2 - torch.exp(gamma * rho_x) - torch.exp(gamma * rho_y) #距离损失omiga_w = torch.abs(w1 - w2) / torch.max(w1, w2)omiga_h = torch.abs(h1 - h2) / torch.max(h1, h2)shape_cost = torch.pow(1 - torch.exp(-1 * omiga_w), 4) + torch.pow(1 - torch.exp(-1 * omiga_h), 4) #形状损失iou = iou - 0.5 * (distance_cost + shape_cost) #siouloss = 1.0 - iou
本文链接地址:https://www.jiuchutong.com/zhishi/298787.html 转载请保留说明!

上一篇:js去掉两个数组相同的元素、js删除数组中某一个对象、js快速查找数组中重复项下标(js去掉数组中的空字符串)

下一篇:无需本地部署 在线使用Stable Diffusion Webui 使用共享模型(无需本地部署的软件)

  • bilibili不能用邮箱注册了吗(b站不能用邮箱注册了吗)

    bilibili不能用邮箱注册了吗(b站不能用邮箱注册了吗)

  • 哔哩哔哩会员可以同时几个人用(哔哩哔哩会员可以退款吗)

    哔哩哔哩会员可以同时几个人用(哔哩哔哩会员可以退款吗)

  • 网页的后缀名(网页的后缀名是ww吗)

    网页的后缀名(网页的后缀名是ww吗)

  • 酷家乐和3dmax区别(酷家乐软件和3d max哪个稍好点)

    酷家乐和3dmax区别(酷家乐软件和3d max哪个稍好点)

  • 电话卡可以异地注销吗(电话卡可以异地注销卡吗)

    电话卡可以异地注销吗(电话卡可以异地注销卡吗)

  • 微信发广告会封号吗(微信发广告会封号多久)

    微信发广告会封号吗(微信发广告会封号多久)

  • WPSWord封面页眉横线怎么去掉(wps封面页眉横线怎么去掉)

    WPSWord封面页眉横线怎么去掉(wps封面页眉横线怎么去掉)

  • 苹果11pro多长(ipone11pro多长)

    苹果11pro多长(ipone11pro多长)

  • 手机扫描二维码扫一扫这一功能使用了什么识别方式(手机扫描二维码的在哪)

    手机扫描二维码扫一扫这一功能使用了什么识别方式(手机扫描二维码的在哪)

  • 抖音怎么开启同城定位(抖音怎么开启同城直播)

    抖音怎么开启同城定位(抖音怎么开启同城直播)

  • ipadair2是什么时候上市的(ipad air2是哪一年上市的)

    ipadair2是什么时候上市的(ipad air2是哪一年上市的)

  • 华为m6怎么外接u盘(华为m6怎么接u盘)

    华为m6怎么外接u盘(华为m6怎么接u盘)

  • 戴尔笔记本充电器是不是通用的(戴尔笔记本充电器插上电源灯亮一下就灭了)

    戴尔笔记本充电器是不是通用的(戴尔笔记本充电器插上电源灯亮一下就灭了)

  • ipadair2怎么强制关机(ipad2怎么强制重启)

    ipadair2怎么强制关机(ipad2怎么强制重启)

  • 抖音怎么锁住喜欢(怎么锁住抖音喜欢)

    抖音怎么锁住喜欢(怎么锁住抖音喜欢)

  • 华为mate305G版怎么更新系统(华为mate305g怎么用)

    华为mate305G版怎么更新系统(华为mate305g怎么用)

  • 淘宝八载提醒怎么处理(淘宝提醒的宝贝在哪)

    淘宝八载提醒怎么处理(淘宝提醒的宝贝在哪)

  • 淘宝账户保护怎么解除(淘宝的账户保护是什么意思)

    淘宝账户保护怎么解除(淘宝的账户保护是什么意思)

  • word的模板在哪儿(word模板在哪个选项卡)

    word的模板在哪儿(word模板在哪个选项卡)

  • 微信打电话按了静音对方能知道吗(微信打电话了之后手机关机了会显示什么)

    微信打电话按了静音对方能知道吗(微信打电话了之后手机关机了会显示什么)

  • qq音乐怎么查看听一首歌的次数(qq音乐怎么查看登录设备记录)

    qq音乐怎么查看听一首歌的次数(qq音乐怎么查看登录设备记录)

  • 苹果x防误触在哪里设置(苹果x防误触在哪)

    苹果x防误触在哪里设置(苹果x防误触在哪)

  • 华为万能遥控器在哪里(华为万能遥控器app)

    华为万能遥控器在哪里(华为万能遥控器app)

  • 相互宝父母暂时无法加入(相互宝父母退出后子女还可以继续)

    相互宝父母暂时无法加入(相互宝父母退出后子女还可以继续)

  • 华为mate20x防水吗

    华为mate20x防水吗

  • Win10系统如何更改窗口组件字体大小 Win10更改窗口组件字体大小方法(win10系统如何更改工作组)

    Win10系统如何更改窗口组件字体大小 Win10更改窗口组件字体大小方法(win10系统如何更改工作组)

  • Vue--》搭配Bootstrap实现Vue的列表增删功能(vue怎么用bootstrap)

    Vue--》搭配Bootstrap实现Vue的列表增删功能(vue怎么用bootstrap)

  • 企业所得税年报怎么查询
  • 多缴纳的附加税可以以后期间抵扣吗
  • 无发票的费用怎样补交所得税
  • 研发费用直接计入成本吗
  • 建筑业企业纳税人税率是多少
  • 实验室报销发票
  • 退回来的增值税税费怎么做账务处理
  • 原材料保险公司赔偿会计分录怎么写
  • 从基本存款账户之外的银行结算账户转账存入
  • 印花税按次申报和按期申报区别
  • 仓储部门折旧计入什么科目
  • 房地产建造运费怎么计算
  • 工程服务税收的分类
  • 企业所得税核定征收怎么计算
  • 研发废料收入实务中如何冲减研发费用?
  • 免税项目进项税为什么不可以抵扣
  • 制造费用月末需要结转吗
  • 房产契税什么时候可以退
  • 怎么知道一个公众号有多少人关注
  • 上年度开具的发票存根联损毁应该怎么做
  • 出售报废固定资产的净损失计入什么科目
  • php获取图片
  • PHP:curl_reset()的用法_cURL函数
  • php 代码
  • php数组有哪几种类型
  • tim模块
  • ipad air3发布会价格
  • yii2框架结构
  • citespace关键词共现分析
  • vue使用scss报错
  • vue项目如何打包成dist
  • 分期收款企业所得税确认时间
  • vue区别
  • 投资性房地产在资产负债表中的列示
  • man-s命令
  • 计提营业税金及附加比例
  • css代码怎么在浏览器运行
  • 6.824 Lab 1: A simple web proxy
  • 小规模纳税人货款怎么算
  • mongodb 数据文件
  • 月末半成品也需要结转生产成本
  • 未实际支付的成本能否列支
  • 不征税收入怎么做会计分录
  • 代收的车船税没有发票怎么入账
  • 待抵扣进项税额分录
  • 制造费用包括哪些内容科目
  • 收到客户预付款会计分录
  • 物流辅助服务属于
  • 补交以前年度环保税
  • 主营业务税金及附加借贷方向
  • 2020发票丢失新规
  • 非流动资产减少
  • 差旅费一般包括往返及当地的交通费
  • 房地产一般纳税人可以不预缴增值税吗?
  • 期间费用率怎么算
  • 极速开票软件怎么开票
  • 查询存储过程中的文件
  • sql2005和2000区别
  • Linux/Mac MySQL忘记密码命令行修改密码的方法
  • linux系统的介绍
  • Windows Update XP SP3官方下载地址
  • linux如何进行命令操作
  • red hat linux安装
  • win10系统玩游戏闪退怎么解决
  • wire软件下载
  • linux的关闭命令
  • 深入理解中国式现代化
  • nodejs搭建本地资源服务器
  • node 操作mysql
  • python关键字none
  • js控制style
  • python生成txt文档
  • 世界坐标转换成屏幕坐标
  • javascript取随机数
  • js动态改变网页标题
  • javascript运用
  • javascript的
  • python中的编码
  • jquery的validate前端表单验证
  • 增值税预缴税款退税申请怎么写
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设