位置: IT常识 - 正文

OpenCV中的图像处理 —— 傅里叶变换+模板匹配(opencv如何显示图片)

编辑:rootadmin
OpenCV中的图像处理 —— 傅里叶变换+模板匹配 OpenCV中的图像处理 —— 傅里叶变换+模板匹配

推荐整理分享OpenCV中的图像处理 —— 傅里叶变换+模板匹配(opencv如何显示图片),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:opencv图形界面,opencv如何显示图片,opencv 图像,opencv的图像处理函数,opencv 图像,opencv 图像,opencv的图像处理函数,opencv的图像处理函数,内容如对您有帮助,希望把文章链接给更多的朋友!

现在也在逐渐深入啦,希望跟大家一起进步越来越强

目录OpenCV中的图像处理 —— 傅里叶变换+模板匹配1. 傅里叶变换1.1 Numpy实现傅里叶变换1.2 OpenCV实现傅里叶变换1.3 DFT的性能优化2. 模板匹配2.1 单对象的模板匹配2.2 多对象的模板匹配1. 傅里叶变换

关于傅里叶变换最重要的两个概念:时域与频域。以时间作为参照来观察动态世界的方法我们称其为时域分析,而频域是什么呢,它是描述信号在频率方面特性时用到的一种坐标系,频域图显示了在一个频率范围内每个给定频带内的信号量。贯穿时域与频域的方法之一就是大名鼎鼎的傅里叶分析,它可以分为傅里叶级数和傅里叶变换,傅里叶变换也就是我们这一部分要说的东西

傅里叶变换是分析线性系统的一个有力工具。 它告诉我们任何周期函数,都可以看作是不同振幅,不同相位正弦波的叠加。从数学意义上说,傅里叶变换将一个任意的周期函数分解成为无穷个正弦函数的和的形式;从物理效果上看,傅里叶变换实现了将信号从空间域到频率域的转换

在计算机视觉中傅立叶变换用于分析各种滤波器的频率特性,对于图像,使用2D离散傅里叶变换(DFT)查找频域(还有一种称为快速傅立叶变换(FFT)的快速算法)这一段文字是不是不太好理解,因为里面涉及太多比较深奥的东西了,傅里叶变换本身是比较难的一个点,在这里我就不细说了,我们只说说在计算机视觉领域我们是怎么用它的,想要深入了解的同学来看看这篇文章:深入浅出的讲解傅里叶变换(真正的通俗易懂)

对于正弦信号,如果幅度在短时间内变化比较快,则可以说它是高频信号,如果变化缓慢,则为低频信号,我们可以将相同的想法扩展到图像,图像中的振幅在哪里急剧变化?当然是在边缘点或噪声,因此,可以说边缘和噪声是图像中的高频内容

1.1 Numpy实现傅里叶变换

Numpy提供了FFT软件包来查找傅里叶变换,np.fft.fft2()为我们提供了频率转换,它将是一个复杂的数组,它的第一个参数是输入图像(灰度图像),第二个参数是可选的,它决定输出数组的大小。如果它大于输入图像的大小,则在计算FFT之前用零填充输入图像。如果小于输入图像,将裁切输入图像。如果未传递任何参数,则输出数组的大小将与输入的大小相同,但是现在获得的结果它的零频率分量(DC分量)将位于左上角,为了便于分析我们要把它居中,居中处理关系到np.fft.fftshift()函数

import cv2 as cvimport numpy as npfrom matplotlib import pyplot as pltimg = cv.imread(r'E:\image\test16.png', 0)f = np.fft.fft2(img)fshift = np.fft.fftshift(f)magnitude_spectrum = 20 * np.log(np.abs(fshift))plt.subplot(121), plt.imshow(img, cmap='gray')plt.title('Input Image'), plt.xticks([]), plt.yticks([])plt.subplot(122), plt.imshow(magnitude_spectrum, cmap='gray')plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])plt.show()

我们可以看到幅度谱的中心有更多白色区域,说明图像低频内容更多。找到了幅度谱那我们是不是可以在频域中进行一些操作呢?例如高通滤波和重建图像,实质就是找到逆DFT,我们首先要用尺寸为60*60的矩形窗口遮罩抵消低频信号,然后使用np.fft.ifftshift()应用反向移位,以使DC分量再次出现在左上角。然后使用np.ifft2()函数找到逆FFT,结果同样是一个复数

import cv2 as cvimport numpy as npfrom matplotlib import pyplot as pltimg = cv.imread(r'E:\image\test15.png', 0)f = np.fft.fft2(img)fshift = np.fft.fftshift(f)magnitude_spectrum = 20 * np.log(np.abs(fshift))rows, cols = img.shapecrow, ccol = rows//2, cols//2fshift[crow - 30:crow + 31, ccol - 30:ccol + 31] = 0f_ishift = np.fft.ifftshift(fshift)img_back = np.fft.ifft2(f_ishift)img_back = np.abs(img_back)plt.subplot(131), plt.imshow(img, cmap='gray'),plt.title('Input Image'), plt.xticks([]), plt.yticks([])plt.subplot(132), plt.imshow(magnitude_spectrum, cmap='gray')plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])plt.subplot(133), plt.imshow(img_back)plt.title('Result in JET'), plt.xticks([]), plt.yticks([])plt.show()OpenCV中的图像处理 —— 傅里叶变换+模板匹配(opencv如何显示图片)

1.2 OpenCV实现傅里叶变换

OpenCV为此提供了cv.dft()和cv.idft()函数。它返回与前一个相同的结果,但是有两个通道。第一个通道是结果的实部,第二个通道是结果的虚部。输入图像首先应转换为np.float32

import cv2 as cvimport numpy as npfrom matplotlib import pyplot as pltimg = cv.imread(r'E:\image\test17.png', 0)dft = cv.dft(np.float32(img), flags=cv.DFT_COMPLEX_OUTPUT)dft_shift = np.fft.fftshift(dft)magnitude_spectrum = 20 * np.log(cv.magnitude(dft_shift[:, :, 0], dft_shift[:, :, 1]))plt.subplot(121), plt.imshow(img, cmap='gray')plt.title('Input Image'), plt.xticks([]), plt.yticks([])plt.subplot(122), plt.imshow(magnitude_spectrum, cmap='gray')plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])plt.show()

这一块儿代码有几个难懂的地方,没关系我们来分析一下:第一次看这段代码会有几个疑问,cv.dft()函数的参数怎么传递?cv.magnitude()函数是怎么用的?

cv.dft()函数的作用是对一维或者二维浮点数数组进行正向或反向离散傅里叶变换,其中包括4个参数,第一个即源图像,第二个参数是OutputArray类型的dst,函数调用后返回的运算结果存在这里,它的尺寸和类型取决于第三个参数flags转换标识符,它的默认值为0(参考自:opencv:dft()函数详解)

cv.magnitude()函数用来计算二维矢量的幅值,其中包括3个参数,第一个是InputArray类型的x,表示矢量的浮点型X坐标值,也就是实部,第二个参数是InputArray类型的y,表示矢量的浮点型Y坐标值,也就是虚部,第三个参数是输出的幅值

接下来我们需要做OpenCV中DFT的逆变换,上一节用了高通滤波器HPF,这一部分我们会将低通滤波器LPF应用到图像中

注意:通常,OpenCV函数cv.dft()和cv.idft()比Numpy函数更快,大约快3倍,但是Numpy函数更容易使用

我们把这一部分的代码放在后面,与DFT的性能优化放在一起更容易理解

1.3 DFT的性能优化

对于某些数组尺寸,DFT的计算性能较好,例如当数组大小为2的幂时,速度最快,对于大小为2、3和5的乘积的数组,也可以非常有效地进行处理,关于代码的性能问题,我们可以在找到DFT之前将数组的大小修改为任何最佳大小(通过填充零),对于OpenCV,我们必须手动填充零,但是对于Numpy,指定FFT计算的新大小,它将自动为您填充零

关于寻找最优大小,OpenCV为此提供了一个函数:cv.getOptimalDFTSize()

import cv2import numpy as npfrom matplotlib import pyplot as pltimg = cv2.imread(r'E:\image\test17.png', 0)rows, cols = img.shapeprint(rows, cols)# 计算DFT效率最佳的尺寸nrows = cv2.getOptimalDFTSize(rows)ncols = cv2.getOptimalDFTSize(cols)print(nrows, ncols)nimg = np.zeros((nrows, ncols))nimg[:rows, :cols] = imgimg = nimg# OpenCV计算快速傅里叶变换,输入图像应首先转换为np.float32,然后使用函数cv2.dft()和cv2.idft()。# 返回结果与Numpy相同,但有两个通道。第一个通道为有结果的实部,第二个通道为有结果的虚部。dft = cv2.dft(np.float32(img), flags=cv2.DFT_COMPLEX_OUTPUT)dft_shift = np.fft.fftshift(dft)magnitude_spectrum = 20 * np.log(cv2.magnitude(dft_shift[:, :, 0], dft_shift[:, :, 1]))plt.subplot(121), plt.imshow(img, cmap='gray')plt.title('Input Image'), plt.xticks([]), plt.yticks([])plt.subplot(122), plt.imshow(magnitude_spectrum, cmap='gray')plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])plt.show()rows, cols = img.shapecrow, ccol = rows // 2, cols // 2# 首先创建一个mask,中心正方形为1,其他均为0# 如何删除图像中的高频内容,即我们将LPF应用于图像。它实际上模糊了图像。# 为此首先创建一个在低频时具有高值的掩码,即传递LF内容,在HF区域为0。mask = np.zeros((rows, cols, 2), np.uint8)mask[crow - 30:crow + 30, ccol - 30:ccol + 30] = 1# 应用掩码Mask和求逆DTFfshift = dft_shift * maskf_ishift = np.fft.ifftshift(fshift)img_back = cv2.idft(f_ishift)img_back = cv2.magnitude(img_back[:, :, 0], img_back[:, :, 1])plt.subplot(121), plt.imshow(img, cmap='gray')plt.title('Input Image'), plt.xticks([]), plt.yticks([])plt.subplot(122), plt.imshow(img_back, cmap='gray')plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])plt.show()

版权

本文链接地址:https://www.jiuchutong.com/zhishi/300297.html 转载请保留说明!

上一篇:第09章_异常处理(异常处理流程为哪几个部分)

下一篇:疑问搞懂,python中文词频统计,让你真能学会(python答疑)

  • 2017最新微信公众号加粉丝的方法(新版微信公众平台)

    2017最新微信公众号加粉丝的方法(新版微信公众平台)

  • nsa非独立组网什么意思(nsa非独立组网全称)

    nsa非独立组网什么意思(nsa非独立组网全称)

  • 电脑版WPS怎么做下拉框(电脑版wps怎么做表格文档)

    电脑版WPS怎么做下拉框(电脑版wps怎么做表格文档)

  • 用迅雷哥在线观看会自动上传吗

    用迅雷哥在线观看会自动上传吗

  • airpods反应慢(airpods反应不灵敏)

    airpods反应慢(airpods反应不灵敏)

  • pr标记快捷键(pr标记是哪个键)

    pr标记快捷键(pr标记是哪个键)

  • 相机前置和后置哪个真实(相机前置和后置哪个好看)

    相机前置和后置哪个真实(相机前置和后置哪个好看)

  • 苹果6s是全网通吗

    苹果6s是全网通吗

  • 微信聊天记录别人能看见吗(微信聊天记录别人可以查出来吗)

    微信聊天记录别人能看见吗(微信聊天记录别人可以查出来吗)

  • qcy耳机只能连一个怎么办(qcy一只耳机连不上)

    qcy耳机只能连一个怎么办(qcy一只耳机连不上)

  • qq一个太阳等于几个月亮(qq一个太阳等于几个月亮几个星星)

    qq一个太阳等于几个月亮(qq一个太阳等于几个月亮几个星星)

  • 手机锁屏怎么取消(手机锁屏怎么取消掉)

    手机锁屏怎么取消(手机锁屏怎么取消掉)

  • eva-al00是什么型号(eva al00是华为什么型号)

    eva-al00是什么型号(eva al00是华为什么型号)

  • ps最大兼容是怎么回事(ps最大兼容怎么打开)

    ps最大兼容是怎么回事(ps最大兼容怎么打开)

  • bm37是小米什么型号(小米bm39)

    bm37是小米什么型号(小米bm39)

  • 微信旺柴表情是什么意思(微信里的旺柴表情)

    微信旺柴表情是什么意思(微信里的旺柴表情)

  • 计算器ac键有什么作用(计算器ac键的功能是什么)

    计算器ac键有什么作用(计算器ac键的功能是什么)

  • 怎么找回之前的抖音号(怎么找回之前的照片)

    怎么找回之前的抖音号(怎么找回之前的照片)

  • 华为p30微信不提醒(华为p30微信不提示)

    华为p30微信不提醒(华为p30微信不提示)

  • mysql有必要升级8吗(mysql5升级到8)

    mysql有必要升级8吗(mysql5升级到8)

  • mq9f2ll/a是苹果什么版(苹果mq9d2是什么版本)

    mq9f2ll/a是苹果什么版(苹果mq9d2是什么版本)

  • 探探匿名表白会暴露么(探探匿名表白对方收到怎样的信息)

    探探匿名表白会暴露么(探探匿名表白对方收到怎样的信息)

  • 怎么知道照片多少k(怎么知道照片多大尺寸)

    怎么知道照片多少k(怎么知道照片多大尺寸)

  • 微信被好友拉黑了怎么恢复正常(微信被好友拉黑了怎么办才能联系对方)

    微信被好友拉黑了怎么恢复正常(微信被好友拉黑了怎么办才能联系对方)

  • 阿拉普扎的船屋,印度喀拉拉邦 (© Martin Harvey/The Image Bank/Getty Images)(阿普拉萨)

    阿拉普扎的船屋,印度喀拉拉邦 (© Martin Harvey/The Image Bank/Getty Images)(阿普拉萨)

  • 动产租赁税率是多少2023
  • 房地产开发公司组织架构
  • 防伪税控风险纳税人财务负责人和法人同一人
  • 公司有流水不申报会怎么样
  • 公司代缴个税分录
  • 合并业务的好处
  • 销售商品收入确认的五个条件
  • 签订代销合同的人有没有退货权
  • 所得税弥补以前的利润
  • 公司出让土地是利好
  • 银行结算方式包括哪些内容
  • 营改增后场地租赁税率
  • 在年度汇算清缴前取得去年成本发票
  • 劳务派遣工资需要发票吗
  • 批发企业购进商品发生的进货费用可以选择下列
  • 可以做投标保证金的有银行汇票银行保函
  • 利润的三个计算口径
  • 出口佣金比例
  • 工资扣税标准计算方法
  • 微软雅黑字体一般用在哪里
  • 企业所得税税负率多少合适
  • 处理废料的会计分录
  • 企业支付个人劳务费需要发票吗
  • 生产经营所得投资者减除费用季度申报填吗
  • 开发成本怎么核算
  • 微软发布windows
  • 购买材料支出属于资本性支出吗
  • 家里有蟑螂怎么找到窝
  • PHP:mcrypt_module_get_algo_block_size()的用法_Mcrypt函数
  • 超期未认证的发票怎么处理
  • php写一个函数,对手机号做基础的判断和处理
  • 网络电话综合布线
  • android应用程序开发语言
  • 通过云服务器租号安全吗
  • 承兑贴现会计分录怎么做
  • controller层,service层,dao
  • 万能的python
  • 进口商品销售的会计分录
  • 资产负债表中应交税费为负数是什么意思
  • 外币存款利息税
  • 织梦自定义字段
  • 开专票一定要写明细吗
  • 可以抵扣增值税进项税额的有哪些
  • 微店企业店铺和个人店铺的区别
  • mysql错误代码1067
  • 公司找个人干活
  • 在建工程和预付账款怎么转化
  • 银行汇票退票
  • 财产转让收入属于什么收入
  • 预付账款年底怎么调账
  • 服装厂布料都是在哪里进的
  • 关于母子公司的关系的表述,正确的是( )
  • 付别人押金的会计分录
  • 农民专业合作社属于什么经济类型
  • 凭证扣除 28号
  • 什么是大病医疗救助
  • 汽车费用包括哪些会计科目呢
  • 什么叫残保金减免
  • 分区时把磁盘格式化了,如何恢复
  • ubuntu2004分区教程
  • window8怎么样
  • win7怎么开不了机
  • windows10预览版怎么样
  • win7系统360浏览器收藏夹位置
  • windows下合并分区
  • 控制面板win8在哪里
  • javascript entries
  • android开发地图应用
  • opengl渲染流程图
  • js 运算符
  • shell脚本 su
  • 蛋疼的生活歌曲
  • unityshader
  • js window.screen
  • textview在哪
  • python如何运用
  • 云南省税务局咨询电话
  • 1992年2月20号是什么
  • 如何理性看待出轨
  • 北京市税务局热搜
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设