深度学习之语义分割-RefineNet

模型

image.png

说明

  • 图a)代表的是标准的CNN结构

  • 图b)代表的是带孔卷积dilated convolutions

  • 图c)代表的是RefineNet的思路

    • 每一个小模块是一个RefineNet

    • 融合了不同尺度下的RefineNet结果

    • 最终upsample到原图的1/4大小

image.png

每一个RefineNet是多个残差模块作为输入

RefineNet-4的filter个数为512

其他残差模块的filter个数为256

每一个基础模型中的输出,进行两次残差计算RCU模块

每一个RCU输出结果,都经过Multi-resolution Fusion模块

3x3conv+upsample,上采样到该层最大的分辨率

将不同的输入进行求和

上一层融合的结果进行CRP模块【默认采用2个pool层】

经过一次ReLU非线性激活

证明该操作对于后面的pool操作非常有用

使得模型对于学习率变的没有那么敏感了

该操作没有是的网络的梯度传递变的效率低

经过3次pool+conv然后sum融合操作

每一次pool为上一层pool+conv的结果

pool操作的步长为1

注:CRP模块的作用:能够捕获背景纹理

最后接一个RCU模块【残差模块】作为输出

RefineNet-1中在softmax之前,采用了2个RCU模块作为输出

不同的网络结构

image.png

image.png

效果

VOC数据集上的效果

image.png

image.png

其他数据集效果

image.png

image.png

image.png

image.png

image.png

image.png

image.png


总结

本文提出了一种multi-path refinement的网络结构,通过long-range和short-range的残差模型的多层连接,能够将high-level semantics和low-level features有效的融合映射到原图高分辨的分割信息上。


参考文献

https://arxiv.org/abs/1611.06612


————————————————

版权声明:本文为CSDN博主「leo_whz」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/whz1861/article/details/79118485



本文出自勇哥的网站《少有人走的路》wwww.skcircle.com,转载请注明出处!讨论可扫码加群:

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

会员中心
搜索
«    2025年4月    »
123456
78910111213
14151617181920
21222324252627
282930
网站分类
标签列表
最新留言
    热门文章 | 热评文章 | 随机文章
文章归档
友情链接
  • 订阅本站的 RSS 2.0 新闻聚合
  • 扫描加本站机器视觉QQ群,验证答案为:halcon勇哥的机器视觉
  • 点击查阅微信群二维码
  • 扫描加勇哥的非标自动化群,验证答案:C#/C++/VB勇哥的非标自动化群
  • 扫描加站长微信:站长微信:abc496103864
  • 扫描加站长QQ:
  • 扫描赞赏本站:
  • 留言板:

Powered By Z-BlogPHP 1.7.2

Copyright Your skcircle.com Rights Reserved.

鄂ICP备18008319号


站长QQ:496103864 微信:abc496103864