位置: IT常识 - 正文

图像识别算法汇总(图像识别算法汇总表)

编辑:rootadmin
图像识别算法汇总 图像识别算法汇总什么是图像识别?图像识别如何为人类工作?图像识别如何与机器一起工作?通过机器学习练习图像识别流程和模型设置、训练和测试机器学习图像识别支持矢量机(SVM)图像检索模型Viola-Jones算法卷积神经网络基于区域FasterRCNNSSDYOLO机器学习图像识别的不同应用领域面部识别健康与医学智慧农业安保和安全电子商务

推荐整理分享图像识别算法汇总(图像识别算法汇总表),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:图像识别算法汇总,图像识别实战,图像识别领域有哪些常用算法,图像识别算法汇编,图像识别实战,图像识别算法汇编,图像识别算法汇总,图像识别算法汇编,内容如对您有帮助,希望把文章链接给更多的朋友!

如今,人工智能和计算机视觉在我们身边无处不在:要求Siri安排下一次财务会议,使用面部识别解锁手机等。人工智能与计算机视觉是科技行业的突出话题。人工智能依赖于许多不同的工具和技术来模仿人类智能,并通过在不同设备上应用的各种算法来重建它。计算机视觉是一个关注机器分析和理解图像和视频的能力的IT领域,它在机器学习中完成图像识别的任务。

什么是图像识别?

图像识别是一种机制,用于识别图像中的对象,并根据人类识别不同图像集中对象的方式将其分类为特定类别。

图像识别如何为人类工作?

当我们看到一个物体或图像时,作为人类,我们能够立即准确地知道它是什么。人们根据我们在一组物体上识别的属性,将他们所看到的一切分类为不同类别。这样,即使我们不知道物体是什么,我们通常也能够将其与我们过去见过的不同类别的物体进行比较,并根据其属性对其进行分类。让我们以一种我们不认识的动物为例。即使我们不能清楚地识别它是什么动物,我们仍然能够识别它是一种动物。

人们很少思考他们观察事情是什么,以及如何识别物体,这完全是在潜意识中发生的。人们并不总是关注周围的一切。根据我们以前的经验,也就是说,我们的大脑经过训练,能够很容易地识别物体,也就是我们过去已经遇到过的物体。我们确实有一种非凡的推理能力:当我们看到类似于我们以前见过的物体的东西时,我们能够推断出它属于某一类物品。我们不一定需要查看图像的每个部分来识别其中的对象。一旦你看到你认出的物品的一部分,你就知道它是什么。我们通常使用颜色和对比度来识别物品。 对于人类来说,大多数图像识别都是在潜意识中工作的。但是,当涉及到机器的图像识别时,它要复杂得多。

图像识别如何与机器一起工作?

机器只识别我们编程的对象类别。他们天生无法知道和识别他们所看到的一切。如果机器被编程为识别一类图像,它将无法识别程序之外的任何其他图像。机器只能指定一组图像中存在的对象是否对应于该类别。机器是否会尝试将对象放入类别中,还是会完全忽略它。 对于机器,图像仅由数据、像素值数组组成。每个像素包含有关红色、绿色和蓝色颜色值的信息(每个像素从0到255)。对于黑白图像,像素将具有关于暗度和白度值的信息(对于这两个值,从0到255)。 机器不看整个图像;他们只对像素值和这些值中的模式感兴趣。他们只需获取一个项目的像素模式,并将其与其他模式进行比较。如果两个模式足够接近,机器会将它们关联起来,并将第二个模式识别为过去已经遇到过的模式。从这个意义上讲,正在发生的事情是,机器将在图像中寻找相似像素值的组,并将尝试将它们放在特定的图像类别中。 程序100%识别图像是非常罕见的。像素图案在比较时很少100%相同。解决这些问题并找到改进是IT研究人员的工作,其目标是向用户提出可能的最佳体验。

通过机器学习练习图像识别

图像识别的目标是识别、标记和分类检测到的不同类别的对象。物体或图像识别是一个涉及各种传统计算机视觉任务的完整过程:

图像分类:标记图像并创建类别。目标定位:通过用边界框包围对象来识别图像中对象的位置。目标检测:在边界框的帮助下确定对象的存在,并在其所属的类中对其进行分类。目标分割:区分各种元素。识别并定位图片中的每一项。分割不使用边界框,而是突出显示图像中对象的轮廓。

在过去几年中,这项计算机视觉任务取得了巨大的成功,主要得益于机器学习应用。

流程和模型

为了完成这4项任务,机器学习和图像识别系统确实需要完成几个重要步骤。

设置、训练和测试

首先,机器必须确切地知道它要寻找什么。因此,有必要为其提供您决定要处理的参数。定义边界框的尺寸和其中的元素至关重要。为此,机器必须提供一些参考资料,可以是图片、视频或照片等。这些元素将使其在分析未来数据时更有效。这将创建一种数据库,然后由神经网络用于区分各种对象。神经网络由多个人工神经元组成。这些神经元旨在模仿人脑。它与一组不同的算法一起工作,也受到大脑功能的启发。如果我们想让图像识别模型分析和分类不同种族的狗,那么模型需要有一个不同种族的数据库来识别它们。

第二,模型需要进入训练阶段。数据集需要在程序中输入才能正常运行。这一阶段只是为了训练卷积神经网络(CNN)来识别特定的对象,并将它们准确地组织在对应的类中。

在使用人工智能模型之前,需要对其进行彻底测试。要做到这一点,有必要提出不属于培训阶段的图像。根据项目是否能够识别所有项目以及分类的准确性,模型将被批准或不被批准。

以下是一些最流行的机器学习模型图像识别及其工作原理。

机器学习图像识别支持矢量机(SVM)

SVM模型使用一组技术来创建一种算法,该算法将确定图像是否对应于目标对象。根据设置的数据集,SVM模型被训练为将超计划分成几个类别。在此过程中,根据像素值,对象被放置在超计划中,它们的位置基于从训练阶段学习到的类别分离来预测类别。

图像检索模型

模型考虑了要分析的图像和参考样本照片。然后,模型中的算法尝试将样本照片中的像素模式与目标图片的某些部分进行匹配,以进行分析

Viola-Jones算法

这是用于面部识别的最著名的工具之一。甚至在使用CNNs之前就已经使用了它。它扫描人脸,从人脸中提取一些特征,并对其进行分类。它还使用了一种增强算法,旨在帮助进行更准确的分类。

卷积神经网络图像识别算法汇总(图像识别算法汇总表)

我们在本文早些时候已经讨论过CNN。但有必要对这一概念再深入一点。 机器学习依赖于人脑给予它的东西。它主要由人监督,首先是在传送一组参考图像时,训练机器识别物体并测试方法。CNN是深度学习技术的一种特定模型架构。CNN算法允许机器以令人印象深刻的精度检测和分类图片中观察到的所有对象。 这种算法适用于不同层次的感知。通常很难解释最终预测中特定层的作用,但研究已经取得了进展。例如,我们可以解释一个层分析颜色、另一个形状、对象的下一个纹理等。在过程结束时,所有层的叠加使预测成为可能。

目标检测算法主要分为两类:

Two-stage方法:如R-CNN系列算法,主要思路就是通过Selective Search或者CNN网络产生一系列的稀疏矩阵的候选区域,然后对这些候选区域进行分类和回归,two-stage的方法优势在于准确率度高;One-stage方法:如YOLO系列方法,主要思路就是均匀地在图片上不同位置进行密集采样,采样时使用不同尺度和长宽比box,然后利用CNN提取特征后直接进行分类和回归,整个过程只需要一步,所以优势在于速度快。我们接下来介绍的SSD方法也是单阶段的算法。

深度学习已证明在检测对象和对其进行分类方面非常有效。有不同的方法,每个方法都有自己的特点。以下是其中三个程序

基于区域FasterRCNN

更快的RCNN是一种基于区域分析的卷积神经网络算法。当分析新图像时,在使用参考集进行训练后,Faster RCNN将在图片中提出可能发现对象的一些区域。当算法检测到感兴趣的区域时,这些区域随后被边界框包围并裁剪,然后被分析以分类在适当的类别内。为什么它被称为更快的RCNN?因为通过提出可能放置对象的区域,它允许算法进行得更快,因为程序不必在整个图像中导航来分析每个像素模式。

SSD

使用单发探测器算法与RCNN直接相关。在识别和绘制边界框时,大多数情况下,它们彼此重叠。这是使用SSD的主要原因。为了防止这些框重叠,SSD使用具有不同比率的网格来划分图像。然后,如果我们观察到一个盒子放在另一个盒子的上面,例如,因为系统检测到一个女孩在汽车前面,算法建议创建两个不同的锚框,以便将这两个物品分开。这样,图片被划分为不同的特征平面,并被单独处理,机器能够处理更多对象的分析。这项技术显示非常成功、准确,并且可以快速执行。

YOLO

正如算法的名称所暗示的,由于网格大小固定,该技术只能一次性处理整个图片。它在网格的每个部分中查找元素,并确定是否有任何项目。如果是这样,它将被识别为丰富的盒子,然后将其分类。只查看一次网格会使过程变得非常快速,但存在方法不深入细节的风险。结果不如SSD方法准确。

机器学习图像识别的不同应用领域

如今,计算机视觉和识别一直在我们身边。从早上用脸打开手机,到走进商场购物。许多不同的行业已决定在其流程中实施人工智能。

面部识别

人脸分析是一种主要的识别应用。许多公司都使用它来同时检测不同的人脸,例如,为了知道图像中有多少人。警方和安全部队可以使用人脸识别来识别罪犯或受害者。人脸分析涉及性别检测、情绪估计、年龄估计等。

企业识别这些特征的需要很容易理解。它使他们能够准确地分析他们的客户是谁。这样,一家时装店就可以意识到,它的顾客由80%的女性组成,平均年龄在30到45岁之间,顾客似乎不喜欢店里的一篇文章。当他们看到这条绿色裙子时,他们的面部表情往往会感到失望。了解所有这些细节对于他们了解目标并在未来调整沟通至关重要。

面部分析也非常用于识别。苹果最近开发了一种用脸解锁手机的方法。他们甚至开发了一种不摘下外科口罩的方法。

健康与医学

治疗患者可能具有挑战性,有时检查过程中可能会漏掉一个微小的因素,导致医护人员提供错误的治疗。为了防止这种情况发生,医疗保健系统开始分析治疗期间获取的图像。X射线照片、收音机、扫描,所有这些图像材料都可以使用图像识别来检测从一个点到另一个点的单个变化。检测肿瘤、病毒的进展、静脉或动脉异常的出现等。

智慧农业

农民的日常生活远非易事。为了继续照顾好他们的动物和种植园,他们需要监控它们。

对农民来说,监测牲畜已经成为一种舒适的养牛方式。通过配备运动传感器和图像检测程序的摄像机,他们能够确保所有动物的健康。他们还可以监测动物的出生情况。农民可以很容易地发现母牛是否在生小牛时遇到困难。他们可以迅速干预,帮助动物分娩,从而防止两只动物的潜在死亡。

农民也种植自己的植物,主要是为了喂牛。为了查看田地是否健康,可以对图像识别进行编程,以检测植物上是否存在疾病。农民可以迅速处理种植园,并能够和平收获。

安保和安全

安全和保障是当今社会的两大关注点。由于图像识别和检测,识别罪犯或受害者甚至武器变得更加容易。例如,在安全至关重要的机场。整天,安全人员都在仔细检查屏幕。在人工智能的帮助下,他们能够非常迅速地发现危险。当一件行李无人看管时,监视人员可以立即与现场官员取得联系,以便尽快控制局势并保护群众。当出示护照时,会对个人的指纹和面部进行分析,以确保其与原始文件相符。

保险公司也在使用识别技术。当有人投诉抢劫案并要求保险公司赔偿时。后者定期要求受害者提供视频片段或监控图像,以证明重罪确实发生。很多时候,小偷会被摄像头拍到,并被识别出来。有时,有罪的个人会被起诉,并可能因面部识别而面临指控。

电子商务

自新冠肺炎疫情爆发以来,网上商店正经历一场繁荣。由于各种因素,他们设法以指数方式发展自己的活动。

他们最近取得的进步之一是图像识别,以更好地为客户服务。许多平台现在能够根据他们之前观看的内容,识别他们网购者最喜欢的产品,并向他们推荐新的购买商品。

另一方面,一些新的应用程序建议用户只需拍摄他们在街上遇到的人身上发现的物品的照片,就可以找到一家有类似或相同物品可供购买的商店。然后,该算法能够给出一个你可以购买你朋友今天穿的鞋子的地方列表。

过去几十年来,人工智能和图像识别领域取得了巨大的进步。毫无疑问,研究人员已经在寻找基于这些特殊技术提供的所有可能性的新技术。

本文链接地址:https://www.jiuchutong.com/zhishi/300373.html 转载请保留说明!

上一篇:【论文阅读】RePaint: Inpainting using Denoising Diffusion Probabilistic Models(CVPR 2022)(论文resit)

下一篇:JS 数组中的 filter 方法(js 数组中的重数)

  • mx2 root需要flyme账号吗(mx2 root)

    mx2 root需要flyme账号吗(mx2 root)

  • xbox怎么连接笔记本(xboxonex怎么连接笔记本)

    xbox怎么连接笔记本(xboxonex怎么连接笔记本)

  • 苹果11pro和max的区别(苹果11pro和max有啥区别)

    苹果11pro和max的区别(苹果11pro和max有啥区别)

  • 小米cc9e可以用内存卡吗(小米cc9e可以用google吗)

    小米cc9e可以用内存卡吗(小米cc9e可以用google吗)

  • 微信群删了如何恢复(微信群删了如何恢复回来聊天记录)

    微信群删了如何恢复(微信群删了如何恢复回来聊天记录)

  • 惠普7730打印机不认墨盒(惠普7730打印机恢复出厂设置)

    惠普7730打印机不认墨盒(惠普7730打印机恢复出厂设置)

  • 2kb的内存容量可以最多储存多少字(2kb内存最多储存多少个汉字)

    2kb的内存容量可以最多储存多少字(2kb内存最多储存多少个汉字)

  • cad视图缩放快捷键(cad视图缩放快捷键是哪个)

    cad视图缩放快捷键(cad视图缩放快捷键是哪个)

  • multisim中蜂鸣器不响(multisim中蜂鸣器为什么不响)

    multisim中蜂鸣器不响(multisim中蜂鸣器为什么不响)

  • ap频段2.4和5.0哪个快(ap频段2.4和5.0哪个网速快)

    ap频段2.4和5.0哪个快(ap频段2.4和5.0哪个网速快)

  • 携程候补抢票什么意思(携程上候补抢票先支付钱?)

    携程候补抢票什么意思(携程上候补抢票先支付钱?)

  • 微信怎么变成黑色主题(微信怎么变成黑白的了)

    微信怎么变成黑色主题(微信怎么变成黑白的了)

  • 金立s9怎么关掉锁屏(金立手机如何关闭应用程序)

    金立s9怎么关掉锁屏(金立手机如何关闭应用程序)

  • 手机qq版怎么一键删好友(在手机qq)

    手机qq版怎么一键删好友(在手机qq)

  • 荣耀20s双卡怎么切换流量(荣耀20s双卡怎么安装)

    荣耀20s双卡怎么切换流量(荣耀20s双卡怎么安装)

  • iphone11怎么设置自动回复内容(iphone11怎么设置动态壁纸)

    iphone11怎么设置自动回复内容(iphone11怎么设置动态壁纸)

  • 京东实名申诉要多久(京东被实名注册怎么办)

    京东实名申诉要多久(京东被实名注册怎么办)

  • 拼多多删除sku影响权重吗(拼多多删除sku权重多久会恢复)

    拼多多删除sku影响权重吗(拼多多删除sku权重多久会恢复)

  • a11和a12差别大吗(a11和a12差别大么)

    a11和a12差别大吗(a11和a12差别大么)

  • oppo手机怎么打开红外遥控(oppo手机怎么打开开发者选项)

    oppo手机怎么打开红外遥控(oppo手机怎么打开开发者选项)

  • 三星s9可以使用分屏吗(三星s9可以插电信卡吗)

    三星s9可以使用分屏吗(三星s9可以插电信卡吗)

  • 小米max4发布时间(小米max4发布价格)

    小米max4发布时间(小米max4发布价格)

  • 电脑配件有哪些(一台电脑配件有哪些)

    电脑配件有哪些(一台电脑配件有哪些)

  • 主板升级BIOS解决USB键盘插在主板上没反应问题(主板bios在线升级)

    主板升级BIOS解决USB键盘插在主板上没反应问题(主板bios在线升级)

  • 【uniapp】uniapp input 焦点聚焦失败【已解决】(uniapp intent)

    【uniapp】uniapp input 焦点聚焦失败【已解决】(uniapp intent)

  • Visual studio 2019 社区版下载和安装

    Visual studio 2019 社区版下载和安装

  • 房地产企业土地增值税
  • 员工出差车费如何报销
  • 发票可不可以盖财务专用章
  • 社保税局代缴
  • 珠宝首饰可以开发票吗
  • 少做收入第二年怎么算
  • 经常做无票收入没有通过公户收款会有问题吗
  • 二手车买卖如何交税
  • 农产品流通环节有哪些
  • 租赁房屋缴纳什么税
  • 社保基数超过工资
  • 公司没有收入算正常经营吗
  • 个人独资企业是一般纳税人吗
  • 增值税普通发票和普通发票的区别怎么交税
  • 砂石加工行业交什么税
  • 农产品流通环节税收优惠政策
  • 2018年用2015年的发票入账有什么税务的风险?
  • 企业所得税汇算清缴时间
  • 自然人股东转让股权如何避税
  • 有限责任公司自然人独资可以增加股东吗
  • 收到质量赔偿款从总账做账可以
  • 待抵扣进项税额转出会计分录
  • 小规模纳税人可以开专票吗
  • 财政返还额度会计分录
  • 餐饮业现金流
  • 办公家具会计分录怎么做
  • carrier profile
  • 考勤扣款怎么算
  • 如何更改windows11显示语言
  • msoxmled.exe是什么软件
  • 训练自己的GPT
  • centos安装软件教程
  • 研发人员工资计入什么科目
  • 出售一台设备,收到价款20万
  • discuz 首页设置
  • 收到银行结息收据3
  • 其他免税销售额怎么算
  • 小规模纳税人跨区域预缴增值税
  • 写出php的常用四种基本变量类型
  • 帝国cms8.0
  • python子类init
  • 开发商提供物业用房的法律依据
  • 利息收入为什么冲减财务费用
  • 小规模纳税人要报个人所得税吗
  • 个税出现负数是什么意思
  • access speed
  • 让税务局代开的发票直接交纳的税金如何做会计分录?
  • 房屋租赁房产税如何征收
  • 税控盘是什么会计科目
  • sql server临时表的生命周期
  • 长期待摊费用该怎么记账
  • 利润分配科目是所有者权益科目吗
  • 捐赠 赞助 区别
  • 一般纳税人进销不符怎么办
  • 公司没有车加油费怎么报
  • 赠送礼品怎么入账
  • 发票为什么被列为金额
  • 公户转私户的钱会退回吗
  • 网上购物退款后未退回物品怎么投诉
  • 库存结转成本如何计算
  • 应收票据和应付票据可以对冲吗
  • 公司给公司的工会拨款
  • 记账凭证烂了要紧吗
  • 小微企业建账
  • 房地产开发企业开发成本包括哪些项目
  • sql语句示例
  • 任务栏安全中心的图标没有了
  • 开源镜像是什么意思
  • centos7 安全配置
  • rundull32.exe
  • win7连接VPN时提示800错误怎么办 连接VPN时提示错误800解决方法
  • linux shell脚本运行程序
  • 什么是批处理模式
  • Node.js中的全局变量有哪些
  • 手机gpu过度绘制
  • nodejs的组成
  • javascript教程完整版
  • 东莞为什么这么多人
  • 烟丝和烟有什么区别
  • 税务局随机抽查事项清单
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设