计算机视觉与深度学习-图像分割-视觉识别任务03-实例分割-【北邮鲁鹏】

2023-09-21 10:44:34

参考

论文题目:Mask R-CNN

论文链接:论文下载

论文代码:Facebook代码链接;Tensorflow版本代码链接; Keras and TensorFlow版本代码链接;MxNet版本代码链接

参考:Mask R-CNN详解

定义

将图像中的每个像素与其所属的目标实例进行关联,并为每个像素分配一个特定的标签,以实现像素级别的目标定位和分割。

在这里插入图片描述
与目标检测任务不同,目标检测只关注目标的位置和边界框,而实例分割需要在像素级别对目标进行分割,即将每个像素分配到相应的目标实例中。

Mark R-CNN

是在 Faster R-CNN 框架的基础上进行扩展而来。
在这里插入图片描述
Mask R-CNN 的核心思想是在 Faster R-CNN 的基础上添加一个分支,用于预测每个目标实例的像素级掩膜 (mask)。这使得 Mask R-CNN 不仅可以准确地检测目标的位置和类别,还可以对每个目标实例进行精确的像素级分割。

结构

Mask R-CNN 的主要特点和组成部分如下:

  • 区域建议网络(Region Proposal Network, RPN):与 Faster R-CNN 相同,Mask R-CNN 使用 RPN 来生成候选区域。RPN 在输入图像上滑动窗口,并为每个窗口位置生成候选框(anchors),并预测每个候选框是否包含目标。

  • 区域特征提取:Mask R-CNN 使用共享的卷积网络(如 ResNet)来提取候选区域的特征表示。这些特征被用于分类目标类别和回归目标边界框。

  • 目标分类和边界框回归:Mask R-CNN 在 Faster R-CNN 的基础上添加了目标分类和边界框回归分支,用于对每个候选区域进行目标分类和位置调整。

  • 实例分割分支:Mask R-CNN 的关键创新是添加了一个分支来预测每个目标实例的像素级掩膜。这个分支是在每个候选区域上应用全卷积网络,生成一个二进制掩膜来表示目标的精确分割。

思路

具体来说,对于每个候选区域,Mask R-CNN 的实例分割分支会在目标检测局域上再次应用一系列卷积操作来生成目标实例的像素级掩膜。这个过程通常被称为掩膜生成子网络(Mask Head)。

在这里插入图片描述
一般而言,Mask Head 的设计类似于全卷积网络,它会在目标检测局域上对特征图进行进一步处理。具体的步骤如下:

  • 基于ROIAlign的空间金字塔池化(Spatial Pyramid Pooling, SPP):首先,通过ROIAlign操作将每个候选区域对齐为固定大小的特征图块。然后,对每个特征图块应用空间金字塔池化,生成固定大小的特征向量。

  • 一系列的卷积和上采样操作:使用一系列卷积层对特征向量进行进一步处理,以提取和整合更丰富的语义信息。通常,这些卷积层采用具有小卷积核的窄卷积,以减少参数量和计算复杂度。

  • 最终的卷积层:在最后一个卷积层上使用适当的激活函数(如Sigmoid)来生成目标实例的二进制掩膜。每个像素点的输出值表示该像素属于目标的概率。

Mask R-CNN训练阶段使用的Mask样例

训练阶段的标答
在这里插入图片描述

Mask R-CNN实例分割结果

在这里插入图片描述

Mask R-CNN检测姿态

在这里插入图片描述

更多推荐

vision transformer

一、网络构建importtorchfromtorchimportnnfromfunctoolsimportpartial#---------------------------------------##(1)patchembedding'''img_size=224:输入图像的宽高patch_size=16:每个pa

Matlab--高等应用数学问题的MATLAB求解

1.求解n阶导数%%%如何求解n阶导数,用到diff(f,n)symsx;f=sin(x)/(x^2+4*x+3);diff(f,4)%%%如何求解100阶导数tic,F=diff(f,100);toc2.Matlab语言的优越性%%%MATLAB的优点:%MATLAB语言的简洁高效性%MATLAB语言的科学运算功能%

揭秘多数据模型与数据联动如何重塑企业数据处理和决策过程

在数字化时代,数据已经成为企业竞争的核心资源。为了更好地利用数据,许多企业开始采用低代码的多数据模型和数据联动。这些技术和方法可以用于运用多种数据模型来对用户进行分类;可以利用数据联动来提高推荐的准确性和效率,帮助企业更快速、更高效地构建数据驱动的应用程序,从而提升业务效率和竞争力。业务需求说明:1、配置固定资产领用单

Nat. Rev. Bioeng. | 中山大学左涛组详述肠道微生态工程化改造

肠道微生态工程化改造EngineeringthegutmicrobiomeReviewArticle,2023-6-16,NatureReviewsBioengineeringDOI:10.1038/s44222-023-00072-2原文链接:https://www.nature.com/articles/s4422

vue国际化教程

需求背景项目需求要做国际化,结果网上找了好几篇文章,没有一个可以一次性搞定,现在这里总结一下。首先,我们分为两部分处理,一个是前端页面的静态文字,这个由前端vue.json自行处理。第二部分就是后端的错误消息和日志部分,我们由springboot的拦截器来处理。i18n介绍i18n(其来源是英文单词internatio

说说hashCode() 和 equals() 之间的关系?

每天一道面试题,陪你突击金九银十!上一篇关于介绍Object类下的几种方法时面试题时,提到equals()和hashCode()方法可能引出关于“hashCode()和equals()之间的关系?”的面试题,本篇来解析一下这道基础面试题。先祭一张图,可以思考一下为什么?介绍equals()的作用是用来判断两个对象是否相

第二证券:算力概念强势拉升,竞业达涨停,南凌科技等大涨

算力概念20日盘中强势拉升,到发稿,竞业达涨停,南凌科技涨近10%,拓维信息涨近9%,亚康股份、神州数码涨约5%,青云科技涨逾4%。音讯面上,9月19日,国际大学生程序设计竞赛(ICPC)官网披露了华为创始人兼CEO任正非与ICPC基金会及金牌获得者的谈话纪要。任正非表明,我们行将进入波澜壮阔的第四次工业革命,其规划之

Denoising diffusion implicit models 阅读笔记

Denoisingdiffusionprobabilisticmodels(DDPMs)从马尔科夫链中采样生成样本,需要迭代多次,速度较慢。Denoisingdiffusionimplicitmodels(DDIMs)的提出是为了加速采样过程,减少迭代的次数,并且要求DDIM可以复用DDPM训练的网络。加速采样的基本思

许战海战略文库|品类缩量时代:制造型企业如何跨品类打造份额产品?

所有商业战略的本质是围绕着竞争优势与竞争效率展开的。早期,所有品牌立足于从局部竞争优势出发。因此,品牌创建初期大多立足于单个品类。后期增长受限,就要跨品类持续扩大竞争优势,将局部竞争优势转化为长期竞争优势,如果固化不前很难获得增长,也无法成为“链主品牌”。当品类缩量,制造型企业要跨品类打造份额产品第一,聚焦的品类处于增

数据库设计步骤

一、数据库设计重点:有效存储、高效访问1、为什么要进行数据库设计:(1)减少数据冗余;(2)避免数据异常维护;(3)节约存储空间;(4)高效访问;二、数据库设计步骤1、需求分析;2、逻辑设计:ER图等建模;3、物理设计:根据每种数据库特点设计;4、维护优化;三、为什么要进行需求分析1、了解系统中所要存储的数据;2、了解

基于本地持久内存的并行一致性哈希文件系统CHFS

摘要CHFS是一个利用计算节点的持久内存的自适应并行文件系统。该设计完全基于高度可扩展的分布式键值存储,采用一致性哈希算法。CHFS通过消除专用元数据服务器、顺序执行和集中式数据管理,提高了并行数据访问性能和元数据性能的可扩展性。该实施利用了多核和多核CPU、高性能网络和Mochi-Margo库的远程直接内存访问。在一

热文推荐