位置: IT常识 - 正文

(学习笔记一)基于YOLOv5的车辆检测项目(基训包括哪些)

编辑:rootadmin
(学习笔记一)基于YOLOv5的车辆检测项目 1.YOLOv5模型简介

推荐整理分享(学习笔记一)基于YOLOv5的车辆检测项目(基训包括哪些),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:什么叫基训,基训笔记怎么写,什么叫基训,基训技巧是什么,基础知识百度百科,基训笔记,基础知识笔记,基础知识笔记,内容如对您有帮助,希望把文章链接给更多的朋友!

YOLO能实现图像或视频中物体的快速识别,在相同的识别类别范围和识别准确率条件下,YOLO识别速度最快。YOLO有多种模型,其中最新的为V5,V5的特点是速度更快,识别准确率更高,权重文件更小,可以搭载在配置更低的移动设备上。 本次测试采用V5模型,对各种场景下的车辆类型进行批量检测,对检测结果进行分析,重点是道路车辆类别能否得到正确识别,以探讨YOLOv5模型应用于车辆检测的可行性。

2.测试环境搭建2.1下载源码

本次测试采用的是YOLOv5官网提供的最新pytorch框架下的源码,下载完成后将其解压到一个不带中文字符的文件夹下。打开源码文件夹中的requirement.txt文件夹,可以查看YOLOv5运行所需要的环境配置,其中最重要的是Pytorch和torchvision的安装与配置,最新版本的YOLOv5所需要的Pytorch版本要高于1.7.0。

2.2Anaconda与Pycharm的安装与配置

Anaconda是一个管理用于Python开发的包含不同库的虚拟环境的平台,可以高效的管理和创建适用于不同项目的Project interpret。安装完成自带一个根环境,路径在Anaconda的安装目录下,进入后可以在环境管理页面创建新环境,新环境的路径在安装目录下的envs中存储。Pycharm是一种Python IDE,可以方便的帮助用户在使用Python语言开发时提高效率,本项目主要使用Pycharm对源码进行修改。 这两个软件都可以在官网上下载安装,因为本项目使用的Python版本为3.8,对应的Anaconda版本为Anaconda3,安装结束后进入Anaconda Prompt中建立虚拟环境。使用指令

conda create --name pytorch python=3.8

创建一个名称为pytorch,Python版本为3.8的虚拟环境,然后使用指令activate pytorch激活该虚拟环境,当指令行前面括号内由base变为pytorch时,表示该虚拟环境被激活。

2.3CUDA与CUDNN的安装与配置

CUDA是显卡厂商 NVDIA推出的运算平台,CUDA是一种由NVDIA推出的通用并行计算架构,使该架构GPU能够解决复杂的计算问题。CUDNN是用于深度神经网络的GPU加速器。 首先需要将电脑的显卡驱动升级至最新版本,在NVDIA控制面板中查看支持的最高版本的CUDA,打开NVDIA控制面板-帮助-系统信息-组件,可以查看到该版本下支持的最高版本CUDA为10.2.

在官网下载对应版本的CUDA以及CUDNN,安装CUDA结束后更改路径,在电脑的高级系统设置-环境变量-Path中新建环境变量,将

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.1\lib\x64C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.1

两个路径添加进Path中。

将CUDNN解压后,将其中的所有内容复制到以下路径中:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1

打开cmd输入nvcc -V验证CUDA是否安装成功,出现下面界面即为成功。

2.4Pytorch和torchvision的安装与配置

在官网上下载适合自己电脑的Pytorch和torchvision版本,这两个软件需要与CUDA和python版本对应。我的环境对应的版本如下图所示:

(学习笔记一)基于YOLOv5的车辆检测项目(基训包括哪些)

下载完成后需要进入Anaconda Prompt的虚拟环境中,找到文件对应的路径,安装这两个软件,这里我们使用镜像源来加速安装,采用离线安装的方式,在cmd中输入指令:

pip install 包名 -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com

安装结束后打开python,输入下图所示的指令,没有报错且最后输出为Ture,则安装完成。

2.5其他配置文件的安装

将Pytorch和torchvision安装完成后,最后只需将YOLOv5文件中requirement.txt中剩余的库安装完成就结束了。将requirement.txt文件中的torch和torchvision注释掉,依次安装剩余的库。 安装完成后进入到YOLOV5的官网中下载权重文件,考虑到计算机的性能,本项目使用yolov5s.pt权重文件,下载完成后将权重文件放入./weights文件夹下。

2.6Yolov5运行测试

至此yolov5所需要的环境就全部搭建完成了,然后测试YOLOv5是否能正常运行。我们进入Anaconda Prompt的虚拟环境中,进入YOLOv5的文件路径下,输入指令:

python detect.py

若没有报错则安装成功。

3.测试数据和结果3.1数据集的准备与源码修改

数据集可以使用labelimg进行手工标注,但考虑到手工标注的工作量巨大,这里我们使用网上的公共数据集。我们进入https://public.roboflow.com/object-detection官网寻找合适的公开数据集,这里我们选用车辆数据集,将其下载下来。每个数据集中包含test、train和valid三个文件夹,分别对应测试、训练和验证数据集,每个数据集包含images和labels两个文件夹,分别对应图片集和标签集。其中测试集有63张图片,训练集有878张图片,验证集有125张图片,数据集共标注5中车辆类型,分别对应Ambulance、Bus、Car、Motorcycle和Truck。

我们在yolov5\yolov5-master\data下面新建一个coco文件夹,用于存放图片集和标签集,在coco文件夹下面新建images和labels文件夹,然后在这两个文件夹下面再新建两个文件夹train2017和val2017分别用于存放训练集和验证集的图片和标签。

数据集设置完成后,我们对yolov5的源码进行修改,主要修改的是yolov5\yolov5-master\data\coco128.yaml文件和yolov5\yolov5-master\models\yolov5s.yaml文件。其中coco128.yaml文件修改类别数量nc后面的数值和类别名称name后面对应的标签名称;yolov5s.yaml文件修改类别数量nc后面的数值。

将源码修改结束后就可以开始对数据集进行训练了,在yolov5路径下输入指令

python train.py --img 640 --data data/coco128.yaml --cfg models/yolov5s.yaml --weights weights/yolov5s.pt --batch-size 2 --epochs 100

进行训练,其中由于电脑性能限制,我们设置batch-size为2,num-worker为0,epoch次数设置为100,以便获得更高的识别准确度。 训练结束后会自动生成last.pt和best.pt两个权重文件,之后我们会使用这两个权重文件进行图像推断测试和视频推断测试。

3.2推断测试

我们使用65张图片和1个手机拍摄的视频进行推断测试,这些数据都没有在训练集和验证集中出现过,以此来测试识别的准确性。使用best.pt权重文件进行推断测试,部分测试结果如下图所示:

4.测试分析4.1YOLOv5车辆检测的优势

总体来说识别车辆准确,适应性强。具体表现如下: 1.对于多车不会漏检,面向镜头的车辆无论是车头、车位还是车身都能被检测到; 2.只出现一部分的车身也能被检测到,但是也要看是否能体现车辆特征; 3.光线强弱对检测影响不大,只要车辆特征明显都可以被检测到。

4.2YOLOv5车辆检测存在的问题

测试中发现了很多问题,主要分为以下几类: 1.存在漏检,某些明显车辆未能检测到; 2.对于距离较远的车辆可能会出现检测不到或者检测准确度较低; 3.车辆错误识别为其他种类; 4.数据集太小,最终识别的准确度不是很高。

5.结论

这个项目表明:对于道路车辆的识别,如果速度和准确度达到实用程度,那么计算机视觉可以用于车辆监测、自动驾驶等。该模型在数据集不大的情况下仍能取得不错的性能,即使对于复杂路况条件下的车辆识别,也能获得良好的检测结果。然而现有模型的局限性可以通过增大调整数据集和使用性能更好的计算机得到解决。

本文链接地址:https://www.jiuchutong.com/zhishi/298261.html 转载请保留说明!

上一篇:前端学习笔记(14)-Vue3组件传参(前端 教程)

下一篇:vscode里面使用vue的一些插件,方便开发(vue vscode snippets)

  • 实战之网店没流量从优化做起

    实战之网店没流量从优化做起

  • 菜鸟无人车怎么预约(菜鸟无人车怎么预约取件)

    菜鸟无人车怎么预约(菜鸟无人车怎么预约取件)

  • wps怎么做文档分享(wps文档怎么分类)

    wps怎么做文档分享(wps文档怎么分类)

  • 360云盘现在还能用吗(360云盘还能登录吗)

    360云盘现在还能用吗(360云盘还能登录吗)

  • 手机大小尺寸在哪看(手机尺寸在哪里找)

    手机大小尺寸在哪看(手机尺寸在哪里找)

  • qq字符cxp什么意思

    qq字符cxp什么意思

  • 4ghd怎么关闭(4ghd怎么关闭vivo手机)

    4ghd怎么关闭(4ghd怎么关闭vivo手机)

  • foxpro是应用软件吗(vfp6.0是应用软件)

    foxpro是应用软件吗(vfp6.0是应用软件)

  • iphone11微信提示音怎么改(iphone11微信提示音怎么关)

    iphone11微信提示音怎么改(iphone11微信提示音怎么关)

  • 抖音怎么看见好友在线(抖音怎么看见好友在线时间)

    抖音怎么看见好友在线(抖音怎么看见好友在线时间)

  • 微信浏览过的图片保存在哪里(微信浏览过的图片在哪个文件夹)

    微信浏览过的图片保存在哪里(微信浏览过的图片在哪个文件夹)

  • 苹果有背光无显示黑屏(苹果有背光无显示属于质量问题吗)

    苹果有背光无显示黑屏(苹果有背光无显示属于质量问题吗)

  • 网络连接失败91101(网络连接失败91101什么意思)

    网络连接失败91101(网络连接失败91101什么意思)

  • catpart文件用什么软件打开(cat文件用什么打开)

    catpart文件用什么软件打开(cat文件用什么打开)

  • 虾米音乐怎么剪辑铃声(虾米音乐怎么截取音乐片段)

    虾米音乐怎么剪辑铃声(虾米音乐怎么截取音乐片段)

  • iwatch微信聊天记录怎么删除(iwatch微信聊天记录不见了)

    iwatch微信聊天记录怎么删除(iwatch微信聊天记录不见了)

  • 怎么缩小照片的kb(怎么缩小照片的内存)

    怎么缩小照片的kb(怎么缩小照片的内存)

  • 苹果11下载软件怎么用面容(苹果11下载软件怎么按两下)

    苹果11下载软件怎么用面容(苹果11下载软件怎么按两下)

  • pytorch是干什么的(pytorch的好处)

    pytorch是干什么的(pytorch的好处)

  • ipadair3可以分屏吗(ipadair3可以分屏多任务吗)

    ipadair3可以分屏吗(ipadair3可以分屏多任务吗)

  • rmvb手机为什么打不开(为什么手机rmvb格式的视频打不开)

    rmvb手机为什么打不开(为什么手机rmvb格式的视频打不开)

  • 小度可以连接几个手机(小度可以连接几个设备)

    小度可以连接几个手机(小度可以连接几个设备)

  • 韩剧tv再也不能用了吗(韩剧tv不能用了)

    韩剧tv再也不能用了吗(韩剧tv不能用了)

  • 微信冒个泡怎么弄(微信冒个泡怎么用)

    微信冒个泡怎么弄(微信冒个泡怎么用)

  • 对于excel数据库排序是按照什么进行的(对于yggl数据库,表employees的employeeid)

    对于excel数据库排序是按照什么进行的(对于yggl数据库,表employees的employeeid)

  • 【计算机视觉】新冠肺炎COVID-19 CT影片阳性检测,感染区域分割,肺部分割,智慧医疗实践,医疗影像处理示例(计算机视觉需要学什么)

    【计算机视觉】新冠肺炎COVID-19 CT影片阳性检测,感染区域分割,肺部分割,智慧医疗实践,医疗影像处理示例(计算机视觉需要学什么)

  • 同一商品税收分类编码不一样
  • 往来票据如何开具
  • 印花税按照开票金额缴纳可以吗
  • 工程结算扣罚款怎么开票
  • 发票只能全部冲开吗
  • 购买农产品发票买价含税吗
  • 工程围挡做法
  • 异地学习期间产生的餐费住宿费怎么做账?
  • 固定资产计提折旧的方法
  • 医院收到卫生局补助会计分录怎么写
  • 由于疏忽装修费用之前没有摊销应如何处理
  • 企业委托银行收款,银行以办妥手续,而企业尚未收到凭证
  • 土地租金一次付清的会计处理怎么做?
  • 纳税申报一般什么时候
  • 朋友借资质汇款到公司要收税吗?
  • 开给学校的发票要税号吗
  • 土地增值税清算是什么意思
  • 生物性资产是什么
  • 预收账款期末余额在贷方
  • 成本费用跨年度怎么计算
  • 什么叫递延所得税费用?
  • 已认证抵扣的进项税额转出做账的会计处理
  • 日用品做账时放什么东西
  • 怎么加入win11预览计划
  • 4芯网线插线顺序图
  • linux命令df -h结果详解
  • linux系统文件压缩命令
  • win10正版免费下载
  • 企业发放职工薪酬的账务处理例子
  • 一般纳税人普通发票怎么交税
  • 融资性售后回租的账务处理
  • 应收款抹零
  • 存货的毁损通过什么科目核算
  • 固定资产一览表
  • 视同销售的行为
  • 论文 导论
  • 机器学习——图像分类
  • 深入node.js技术栈
  • chatGPT之Python API启用上下文管理
  • 前端手撕代码
  • vue路由跳转的三种方法
  • cp命令复制系统文件/etc/profile
  • insg命令
  • chcp命令
  • 6.824 Lab 1: A simple web proxy
  • 公司开具了电子发票
  • 受托支付转给个人账户需要交税吗为什么
  • 开票日期已超过开票截止日期是什么意思
  • 小企业会计制度的适用对象是
  • 个税手续费返还计入哪个科目
  • 专项附加扣除批量上传怎么上传
  • 销售开票会计分录怎么做
  • 建筑业异地预缴企业所得税怎么算
  • 建筑业有收入没有成本
  • 土地流转的基本原则包括哪些
  • 公账发工资如何记账
  • 融资租赁与经营租赁的区别主要是
  • 冲减应收账款是什么意思
  • sql语句排除重复数据
  • u盘安装win7系统鼠标键盘没反应
  • linux大型软件
  • 家庭版的海鲜大杂烩
  • mac可以远程连接windows吗
  • win10耳机和扬声器有什么区别
  • javascript ts
  • 样式的使用方法
  • python tcp socket
  • flask操作mysql数据库
  • wc -l命令
  • node .js
  • nodejs的组成
  • jquery教程 csdn
  • js有几种模式
  • Android屏幕适配分屏
  • 税务通知书一般什么内容
  • 天然气入户安装收费标准2023
  • 税务师事务所行政登记表怎么办理
  • 关联公司销售
  • 增值税发票打印机怎么调整打印位置
  • 山西增值税优惠政策
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设