SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation|电子爱好者

admin管理员组
文章数量:1663030

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

1. SegNet——《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》
2. DeconvNet——《Learning Deconvolution Network for Semantic Segmentation》（ICCV 2015）

1. SegNet——《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》

标题：SegNet:一种用于图像分割的深度卷积编码器-解码器结构
论文：https://arxiv/pdf/1807.10221v1.pdf
代码：
- https://github/CSAILVision/unifiedparsing（office）
- https://github/CSAILVision/semantic-segmentation-pytorch
研究成果及意义
- 在内存（参数）和准确率之间找到了很好的平衡点
- 将编码解码结构普适化
- 在多个场景数据集（道路、室内）中均取得了很好的结果
摘要：
- 算法结构：提出了SegNet网络，其核心的训练引擎包含一个Encoder网络（采用VGG16，移除全连接层，和FCN一样），和一个对称的Decoder网络，即编码器-解码器结构，并跟随一个用于pixel-wise的分类层
- 文章亮点：Decoder上采样的方式：与Encoder对称，通过Encoder在经过最大池化时保留的polling index 进行非线性上采样（反池化），反池化对保留边界信息有利
- 比较结果：通过比较SegNet 与FCN ，DeepLab-LargeFOV , DenconvNet结构，统筹内存与准确率，Segnet实现了良好的分割效果
- 模型评估：在Camvid （道路场景）和SUN RGB-D indoor （室内场景）数据集中均有评测，评价指标提出了在mIoU 上增加F1 的BF
引言（设计宗旨）
- 近期的许多语义分割研究采用DNN ，但是结果比较粗糙，主要原因是max-pooling 和sub-sampling降低了特征图的分辨率
- 道路场景理解需要算法具有appearance外形、shape形状和理解空间关系(上下文) 的能力。由于是道路场景，因此需要网络能够产生光滑的分割，网络也必须有能力勾画出小尺寸的物体。因此在提取图片特征过程中保留边界信息（boundary localization ）很重要
- 重用max-pooling indices 的优点：提高边界勾画；减少了进行端到端训练的参数；这种上采样形式可以被集成到任何encoder-decoder 架构的网络中
- 典型的道路场景，对小目标边缘信息保留多些，这样才可以刻画的准确点
- Pascal VOC 数据集中有少数Foreground 与Background 有明显区分，这让一些投机者可以使用类似于边缘检测来刷分数。因此本文使用了Camvid ，SunRGBD 这两个数据集，而不是用PascalVOC 数据集
- 场景理解希望模型能够自动识别背景，所以DCNNs （《 Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFS》）用CRF （Conditional random field）后处理方式不符合这个理念，场景理解要设计一个端到端的网络
FCN的缺点：
- 忽略了高分辨率的特征图，会导致边缘信息的丢失
- FCN编码器网络中有大量的参数（124M）,但解码器网络非常小（0.5M）(其实，大部分模型编码器都差不多，主要改进在解码器)；FCN32s 效果很差，所以SegNet采用阶段性的训练过程，即先得到32s ，效果不好，则32s 和上一层解码器结合得到16s ，再看效果，直到没有进一步的性能提升

SegNet是在DeconvNet基础上提出的，所以随便说一下DeconvNet

2. DeconvNet——《Learning Deconvolution Network for Semantic Segmentation》（ICCV 2015）

标题：学习反卷积网络的语义分割
论文：https://arxiv/abs/2103.09460
代码：https://github/megvii-model/YOLOF
文章结构布局很好，值得参考
摘要：
- 算法结构：提出了深度反卷积网络，编码部分使用VGG-16卷积层进行学习，解码器部分使用反卷积与反池化层进行上采样（SegNet只用了反池化层）
  
  图中，中间是两个全连接,在Decoder 部门用的反卷积（黑色方块，因为在做完Unpooling 之后，特征图虽然变大了，但是是比较稀疏的，需要通过卷积将特征密集化，而作者认为反卷积生成密集预测图比卷积能力更强，这也是和SegNet 的区别）
- 文章亮点：由反卷积（deconvolution）和上采样unpooling layers 组成上采样组件，逐像素分类完成预测
- 特殊方式：将object proposal（edge box）送入训练后的网络，整幅图像是这些proposal分割结果的组合，这样就可以解决物体太大（感受野不够大）或者太小（周围多余信息的干扰）所带来的分割问题，改进了现存的基于FCN的方法（也就加入了人工的后处理，所以不是很流行，SegNet的端到端方式更流行）
- 模型评估：算法能识别图像中的精细结构以及不同尺度大小的目标，在PASCAL VOC 2012 数据集中取得了72.5的准确率
引言
- FCN中Decoder对输入特征图，用双线性插值初始化，然后用反卷积做上采样，并将其与相应的编码器特征图组合，以产生下一个Encoder的输入
- FCN由于感受野大小固定，当感受野小于大物体，导致错分；小物体会被当成背景而被忽略；其他论文用跳跃连接（skip architecture ）来解决，有效果，但是融合特征的方式不是处理感受野的根本办法

本文标签： Convolutional Encoder SegNet Deep Image

版权声明：本文标题：SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1729977981a1218255.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

探索图深度学习的前沿：Graph-based Deep Learning Literature 项目推荐

10天前

探索图深度学习的前沿：Graph-based Deep Learning Literature 项目推荐 graph-based-deep-learning-literaturelinks to conference

文献阅读-5：Deep security analysis of program code A systematic literature review

10天前

EassyReadDeep security analysis of program code A systematic literature review.md at main · CoderOFLeeEassyRead (githu

[200715] Understanding of complex parts in literature of deep learning?

10天前

In fact, deep learning is a kind of engineering optimum process. And comparison is the most useful scientific method.

python image.save(pdf)_python 三种方法提取pdf中的图片

10天前

有时我们需要将一份或者多份PDF文件中的图片提取出来，如果采取在线的网站实现的话又担心图片泄漏，手动操作又觉得麻烦，其实用Python也可以轻松搞定！今天就跟大家系统分享几种Python提取 PDF 图片的方法。其实没有非常完美的方法，每

Python PDF转image方法小结

10天前

昨天有一个突发的需求，要求尽快的把一个一百多页的pdf按照页码每页转换成一个jpg文件后打包传回。正好最近一直在学习Python就打算写一个这样的脚本（结果发现踩了坑） Wand 【pypi - Wand】【Wand官网】【Github

深度多视图信息瓶颈：Deep Multi-view Information Bottleneck

8天前

论文题目：Deep Multi-view Information Bottleneck Summary 单个视图的信息瓶颈模型已经发展较为成熟，但尚未有在多视图上的信息瓶颈理论&#xf

论文阅读 [TPAMI-2022] Leveraging Instance-, Image- and Dataset-Level Information for Weakly Supervised I

8天前

论文阅读 [TPAMI-2022] Leveraging Instance-, Image- and Dataset-Level Information for Weakly Supervised Instance Segmentation

李菲菲课程笔记：Deep Learning for Computer Vision – Introduction to Convolution Neural Networks

7天前

转载自：http:www.analyticsvidhyablog201604deep-learning-computer-vision-introduction-convolution-neural-net

论文阅读笔记之——《Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transform》

5天前

本博文是文章《Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transform》也就是SFTGAN的学习笔记。附上论文的连接&a

DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs 阅读笔记

4天前

DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs 阅读笔记引言介绍主要贡献提出的方法总体架构网络结构

论文笔记：DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs

4天前

论文笔记：DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs code&#

Deep Recurrent Q-Learning for Partially Observable MDPs翻译

4天前

摘要深度强化学习已经为复杂任务提供了精准的控制器。但是，这些控制器的内存有限，并且依赖于能够在每个决策点感知完整的游戏画面。为了解决这些缺点，本文研究了用循环LSTM替换

PIL.UnidentifiedImageError: cannot identify image file

3天前

**PIL.UnidentifiedImageError: cannot identify image file** 文章目录 **PIL.UnidentifiedImageError: cannot identify image file

OSError: image file is truncated与PIL.UnidentifiedImageError: cannot identify image file的解决方案

3天前

原因分析在我们使用 PIL 处理图像数据的时候。如果我们的数据集里的某些图片部分损坏或者直接打不开了，就会出现一些错误。比如这个错误OSError: image file is truncated&#xff

OSError: cannot identify image file

3天前

讲在前面：本文实操是在ubuntu系统下，python版本3.5，使用pillow工具from PIL import Image，一开始在环境里没有pillow，后来install了当前最新版本6.0.0。问题描述：在使用Ima

大型数据集含损坏图OSError: image file is truncated和PIL.UnidentifiedImageError: cannot identify image file解决方案

3天前

大型数据集包含损坏图片，报错OSError: image file is truncated 和 PIL.UnidentifiedImageError: cannot identify image file的解决方案

python PIL库image.open()报错cannot identify image file ‘1.jpg‘WEBP

3天前

python PIL库image.open()报错cannot identify image file ‘1.jpg’WEBP 1.导入库时使用import Image 更改为from PIL import Image 2.pill

解决 OSError: cannot identify image file 或者Caught TypeError in DataLoader worker process 8

3天前

跑模型在读取数据时出错如题，找了两个多小时干到深夜依然不能解！！！ 本地把数据过了一遍都是OK的，代码也是一样&#xff0

OSError: cannot identify image file '.datadatasetsamplesP00022.jpg'

3天前

1.读取的图像有问题.(我用U盘拷贝图像,没拷好就弹出u盘导致图像有问题) 2.也有可能pillow版本太高,降到5.3.0, 5.4.1试试.

出现“cannot identify image file 'Users.DS_Store'”问题的解决办法

3天前

“cannot identify image file Users.DS_Store” 在用mac跑深度学习tensorflow框架是制作图片格式向tfrecord格式转化中，读取文件夹中的图片出现系统文件时候报

电子爱好者 - 最新技术资讯及电子产品介绍！

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

1. SegNet——《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》

2. DeconvNet——《Learning Deconvolution Network for Semantic Segmentation》（ICCV 2015）

更多相关文章

探索图深度学习的前沿：Graph-based Deep Learning Literature 项目推荐

文献阅读-5：Deep security analysis of program code A systematic literature review

[200715] Understanding of complex parts in literature of deep learning?

python image.save(pdf)_python 三种方法提取pdf中的图片

Python PDF转image方法小结

深度多视图信息瓶颈：Deep Multi-view Information Bottleneck

论文阅读 [TPAMI-2022] Leveraging Instance-, Image- and Dataset-Level Information for Weakly Supervised I

李菲菲课程笔记：Deep Learning for Computer Vision – Introduction to Convolution Neural Networks

论文阅读笔记之——《Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transform》

DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs 阅读笔记

论文笔记：DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs

Deep Recurrent Q-Learning for Partially Observable MDPs翻译

PIL.UnidentifiedImageError: cannot identify image file

OSError: image file is truncated与PIL.UnidentifiedImageError: cannot identify image file的解决方案

OSError: cannot identify image file

大型数据集含损坏图OSError: image file is truncated和PIL.UnidentifiedImageError: cannot identify image file解决方案

python PIL库image.open()报错cannot identify image file ‘1.jpg‘WEBP

解决 OSError: cannot identify image file 或者Caught TypeError in DataLoader worker process 8

OSError: cannot identify image file '.datadatasetsamplesP00022.jpg'

出现“cannot identify image file 'Users.DS_Store'”问题的解决办法

发表评论

推荐文章

爱奇艺容器实践（内附云原生落地沙龙干货下载）

Matlab系统辨识工具箱

Windows 11设置指纹（Windows Hello）弹窗闪退修复，指纹识别闪退

macOS MontereyBigSur 安装HP打印机驱动

十大音质最好的麦克风推荐，全网口碑最好的麦克风分享

热门文章

火爆GitHub项目，一行命令下载全网视频?

ubuntu18.04突然无法上网解决方法

csv文件删除第一行

estimate()==＞从一组对应的点估算变换是否成功

WMware中的Ubuntu20.04开机黑屏解决方案

vue2案例--类似今日头条新闻浏览

KMS导致浏览器主页被篡改解决方法

计算机的ps快捷键,ps快捷键常用表

计算机表格怎么往下排序,如何在Excel中随机排序表格中的顺序

Java教程：如何申请Java开发微信支付中的必要参数（appid，appsecret，商户号，微信支付密钥）

最新文章

如何在电脑上查看连接的WiFi密码？

中国十大IT论坛网站

soho

注意身体健康-转

程序员发展之路

xp电脑如何链接无线网络连接服务器,台式xp电脑wifi受限怎么解决 xp系统台式机网络提示连接受限的解决办法...

催化剂，抑制剂和变压器：十大主导力量塑造技术

做技术的方向性讨论(论坛帖子整理)

程序员要注意健康一-避免罗京、李钰悲剧：改变我们的酸性体质

看了这篇你肯定瘦 全身上下想瘦哪就瘦哪 - 健康程序员，至尚生活！

好用的WIFI连接工具，替代Windows蠢笨的WIFI连接

Windows查看连接WiFi密码

[转]明朝出了个张居正 作者：秋风浩荡 -3

什么是soho

看了这篇你肯定瘦 全身上下想瘦哪就瘦哪 - 生活至上，美容至尚！

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

看了这篇你肯定瘦全身上下想瘦哪就瘦哪 - 健康程序员，至尚生活！

[转]明朝出了个张居正作者：秋风浩荡 -3

看了这篇你肯定瘦全身上下想瘦哪就瘦哪 - 生活至上，美容至尚！

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载