计算机视觉与深度学习-卷积神经网络-卷积&图像去噪&边缘提取-卷积与边缘提取-[北邮鲁鹏]

2023-09-15 20:17:50

参考学习链接

计算机视觉与深度学习-04-图像去噪&卷积-北邮鲁鹏老师课程笔记

什么是图像边缘?

图像中亮度明显而急剧变化的点

为什么研究边缘?

1 编码图像中的语义与形状信息。

2 相对于像素表示,边缘表示显然更加紧凑。

有哪些边缘种类?

在这里插入图片描述

表面法向不连续

在这里插入图片描述
瓶盖上方的法线向上,瓶盖周围的法线向外。

深度不连续

在这里插入图片描述
真实图片中是不存在的,拍照照到的地方和照不到的地方的边界。

表面颜色不连续

如这几个AOT字母产生的边
在这里插入图片描述
识别物体时需考虑,品牌标签等

光照不连续

在这里插入图片描述
感知物体位置时需要考虑,与周围物体的位置关系。例如:阴影。

如何检测边缘?

边缘处的导数取最值

在这里插入图片描述

图像求导

2D函数f(x,y)的偏导为:

  • 对x的偏导
    ∂ f ∂ x = lim ⁡ ε → 0 f ( x + ε , y ) − f ( x , y ) ε \frac{{\partial f}}{{\partial x}}=\lim_{{\varepsilon \to 0}} \frac{{f(x + \varepsilon, y) - f(x, y)}}{{\varepsilon}} xf=ε0limεf(x+ε,y)f(x,y)
  • 对y的偏导
    ∂ f ( x , y ) ∂ x = lim ⁡ ε → 0 f ( x , y + ε ) − f ( x , y ) ε \frac{{\partial f(x,y)}}{{\partial x}}=\lim_{{\varepsilon \to 0}} \frac{{f(x, y + \varepsilon) - f(x, y)}}{{\varepsilon}} xf(x,y)=ε0limεf(x,y+ε)f(x,y)

图像求导公式

将2D函数中求偏导公式中邻域范围改成1,得到的效果还可以。所以一直沿用。
∂ f ( x , y ) ∂ x ≈ f ( x + 1 , y ) − f ( x , y ) 1 \frac{{\partial f(x,y)}}{{\partial x}} \approx \frac{{f(x + 1, y) - f(x, y)}}{{1}} xf(x,y)1f(x+1,y)f(x,y)

由上图中图像求导公式可知:

图像求导公式 = 右边像素 f ( x + 1 , y ) − 自己 f ( x , y ) 图像求导公式 = 右边像素 f(x + 1,y) - 自己f(x,y) 图像求导公式=右边像素f(x+1,y)自己f(x,y)
因此,图像求导可以通过卷积核实现。
在这里插入图片描述
举例,对图像使用高斯核进行卷积
在这里插入图片描述

x方向求导,检测的是横向像素间差别,求出来是y方向的边。

y方向求导,检测的是纵向像素间差别,求出来是x方向的边。

图像梯度

Δ f = [ ∂ f ∂ x , ∂ f ∂ y ] Δf = [\frac{{\partial f}}{{\partial x}},\frac{{\partial f}}{{\partial y}}] Δf=[xf,yf]
即两个方向的导数组成的向量
在这里插入图片描述

图像梯度的方向

与边缘方向垂直

梯度方向=arctan(对y偏导数 / 对x偏导数)

θ = arctan ⁡ ( ∂ f ∂ x , ∂ f ∂ y ) \theta = \arctan\left(\frac{{\partial f}}{{\partial x}}, \frac{{\partial f}}{{\partial y}}\right) θ=arctan(xf,yf)

梯度方向与信号的方向垂直,求出梯度方向就可以知道信号的方向。

梯度方向是灰度变换最快的方向。

图像梯度的模

用 图像梯度的模 来反映图像的边缘信息。

∣ ∣ V f ∣ ∣ = ( ∂ f ∂ x ) 2 + ( ∂ f ∂ y ) 2 |\left|{\mathcal{V}}f\right||={\sqrt{\left({\frac{\partial f}{\partial x}}\right)^{2}+\left({\frac{\partial f}{\partial y}}\right)^{2}}} Vf=(xf)2+(yf)2
梯度模:值越大表示当前点是边缘的可能性越大。

在这里插入图片描述

噪声的影响

噪声图像的某一行或列的灰度值随位置变换的情况
在这里插入图片描述

噪声影响带来的问题

若对灰度函数直接求导,图像中不能确定最大导数位置。
在这里插入图片描述

解决办法(先平滑处理)

高斯核去噪

从图像上看,每个点都有噪声,这是高斯噪声的特点,所以考虑使用高斯核去噪平滑,之后对去噪后的信号求导。
在这里插入图片描述
缺点:需要进行2次卷积操作,一次f *g,一次求x偏导

  1. 第一次卷积:高斯去噪
  2. 第二次卷积:图像求导(对x求偏导 − 1 ∣ 1 -1|1 1∣1,对y求偏导 1 − 1 \frac{1}{-1} 11

解决办法:卷积交换律(高斯一阶偏导核)

先对高斯卷积核(平滑)进行求导卷积(求导),得到新的卷积核(求导+平滑),再
用这个新的卷积核与原图卷积。

高斯一阶偏导核

高斯卷积+求导卷积

d d x ( f ∗ g ) = f ∗ d d x   g \frac{d}{d x}(f*g)=f*\frac{d}{d x}\,g dxd(fg)=fdxdg

微分是卷积,而卷积具有结合性
在这里插入图片描述
节约了一次图像卷积的操作!

高斯一阶偏导核权值可视化

一半正,一半负。

在这里插入图片描述

高斯一阶偏导卷积核的方差参数
在这里插入图片描述
上图中,从左到右,高斯一阶偏导卷积核的方差分别为1,3,7。

  • 方差大,提取粗粒度轮廓。
  • 方差小,提取细粒度轮廓。
高斯核 vs 高斯一阶偏导核

高斯核

  • 消除高频成分(低通滤波器)
  • 卷积核中的权值不可为负数
  • 权值总和为1(恒定区域不受卷积影响)
    在这里插入图片描述

高斯一阶偏导核

  1. 高斯的导数

  2. 卷积核中的权值可以为负
    在这里插入图片描述

  3. 权值总和是0(恒定区域无响应)

    • 恒定区域无响应,即恒定区域不会有边缘
    • 例如一张全白的图,使用[-3,2] 求导, 1 ∗ ( − 3 ) + 1 ∗ 2 = − 1 1 * (-3) + 1 * 2 = -1 1(3)+12=1,计算结果显示有梯度,与实际不符,全白的图不可能有梯度。所以必须使得权值总和为0,保证像这样的情况才不会出错。
  4. 高对比度点的响应值大

    • 响应值越大,表示该点是边缘点的概率越大。
      在这里插入图片描述

边缘检测目标

Canny边缘检测器

在这里插入图片描述

高斯一阶偏导核卷积图像

在这里插入图片描述
期望得到上图中右图所示很精确的边缘。

高斯一阶偏导核卷积图像的缺点

计算每个点的梯度幅值和方向。

  • 梯度幅值:用来描述该点是不是边缘。
  • 期望得到上图中右图所示很精确的边缘。

在这里插入图片描述
经过高斯一阶偏导核的处理,梯度强度边缘很粗,因为边缘附近的信号,从左到右是慢慢改变的,而不是突然改变的阶梯型,但边缘检测想要更细的边,就需要非极大值抑制。
在这里插入图片描述

非极大值抑制

在这里插入图片描述
p跟梯度方向的正方向距离为1的 r 反方向距离为1的 q 比较梯度强度。

梯度强度p > q && p > r,则保留p点,否则删除p点。

提示:q 点、r 点坐标通常不是整数,其对应的强度需要插值获得!!!
一般r和q不在图像正规的像素点上,通常r和q点的强度需要周边的点加权求和来获得。

但,非最大化抑制的结果中有噪声,需要通过门限值对噪声进行过滤。

门限过滤

在这里插入图片描述

Canny如何选择去噪时的门限值?- 双阈值
  • 高阈值门限:提取高骨干边缘曲线。
  • 低阈值门限:提取链接骨干的边缘曲线。低阈值会筛选出很多边,但只保留与高阈值提取的边有关系的边。
    在这里插入图片描述
更多推荐

redis 持久化机制

1.前言本文将先说明持久化、主存复制(及读写分离)、哨兵、以及集群几种技术分别解决了Redis高可用的什么问题;然后详细介绍Redis的持久化技术,主要是RDB和AOF两种持久化方案;在介绍RDB和AOF方案时,不仅介绍其作用及操作方法,同时介绍持久化实现的一些原理细节及需要注意的问题。最后,介绍在实际使用中,持久化方

蓝牙核心规范(V5.4)11.1-LE Audio 笔记之诞生的前世今生

专栏汇总网址:蓝牙篇之蓝牙核心规范学习笔记(V5.4)汇总_蓝牙核心规范中文版_心跳包的博客-CSDN博客爬虫网站无德,任何非CSDN看到的这篇文章都是盗版网站,你也看不全。认准原始网址。!!!1.LEAudio应用的场景这里面有四个场景是LEAudio最初需要应用的场景。比如助听器行业,这里可以讨论下它的拓扑结构、功

【Java】医院智能导诊系统源码:解决患者盲目就诊问题、降低患者挂错号比例

医院智能导诊系统解决患者盲目就诊问题,减轻分诊工作压力。降低患者挂错号比例,优化患者就诊流程,有效提高线上线下医疗机构接诊效率。患者可通过人体画像选择症状部位,了解对应病症信息和推荐就医科室。一、医院智能导诊系统概述医院智慧导诊系统是在医疗中使用的引导患者自助就诊挂号,在就诊的过程中有许多患者不知道需要挂什么号,要看什

【uniapp+vue3+u-picker】获取中国省市区数据结构,省市区数据三级联动json文件完整版,已实现三级联动效果

前言:这个功能的实现,中间耽误了几天,在大佬的帮助下终于实现效果,匿名感谢xx大佬要实现的效果如下:1、首先需要获取省市区的数据,不考虑后端返数据,自己使用json文件的话,需要获取到完整的中国省市区数据有个很不错的github源码可供参考,Administrative-divisions-of-China中国行政区划

hive的join优化

1.分析数据倾斜情况:可以使用EXPLAIN命令获取Join操作的执行计划,并观察输出中的数据倾斜情况。比如下面的查询语句:EXPLAINSELECT*FROMTable_AJOINTable_BONTable_A.key=Table_B.key;输出的执行计划中,可以通过STAGEPLANS部分中的Reducer和P

Codeforces Round 162 (Div 2)(A - E)

CodeforcesRound162(Div.2)(A-E)Dashboard-CodeforcesRound162(Div.2)-CodeforcesA.ColorfulStones(SimplifiedEdition)(模拟)模拟一下即可#include<bits/stdc++.h>usingnamespacest

网络安全(黑客)自学

前言作为一个合格的网络安全工程师,应该做到攻守兼备,毕竟知己知彼,才能百战百胜。计算机各领域的知识水平决定你渗透水平的上限。【1】比如:你编程水平高,那你在代码审计的时候就会比别人强,写出的漏洞利用工具就会比别人的好用;【2】比如:你数据库知识水平高,那你在进行SQL注入攻击的时候,你就可以写出更多更好的SQL注入语句

泛化误差上界(二分类)

对于二分类问题,当假设空间是有限个函数的集合F={f1,f2,...,fd}F=\{f_1,f_2,...,f_d\}F={f1​,f2​,...,fd​}时,对∀f∈F\forallf\inF∀f∈F,至少以概率1−δ,0<δ<11-\delta,0<\delta<11−δ,0<δ<1,以下不等式成立R(f)≤R^(

【论文笔记】Scene as Occupancy

原文链接:https://arxiv.org/abs/2306.028511.引言与传统的3D框物体表达相比,使用3D占用表达是几何感知的,因为3D框表达简化了物体的形状。此外,现有基于视觉的方法很少考虑时间信息;单阶段方法缺少从粗到细的细化过程。本文提出OccNet,一种基于多视图图像的方法,包含级联体素解码器,利用

PHP-composer安装扩展安装,批量操作合并pdf

清除Composer缓存:运行以下命令来清除Composer的缓存,并再次尝试安装包。bashcomposerclear-cache使用不同的镜像源:Composer使用的默认包源可能会受到限制或访问问题。你可以切换到使用其他镜像源,如阿里云、Composer中国全量镜像等,以提高稳定性和下载速度。你可以使用以下命令更

如何使用requests库发送http请求

一、requests库​什么是Requests?Requests是⽤Python语⾔编写,基于urllib,采⽤Apache2Licensed开源协议的HTTP库。它⽐urllib更加⽅便,可以节约我们⼤量的⼯作,完全满⾜HTTP测试需求。​安装:cmd命令行执行pipinstallrequests二、HTTP请求方法

热文推荐