膨胀卷积(DILATED CONVOLUTIONS)

编程入门 行业动态 更新时间:2024-10-07 16:15:08

膨胀<a href=https://www.elefans.com/category/jswz/34/1765938.html style=卷积(DILATED CONVOLUTIONS)"/>

膨胀卷积(DILATED CONVOLUTIONS)

膨胀卷积(DILATED CONVOLUTIONS)是在卷积核的元素之间插入一些额外的空间,而插入空间的量由参数膨胀因子d (dilation rate)来控制, 通常有d-1个空间在卷积核元素之间被插入,这样普通卷积就对应着d=1的特殊膨胀卷积。膨胀卷积是在论文MULTI-SCALE CONTEXT AGGREGATION BYDILATED CONVOLUTIONS中开始普及的。

下面的两个gif图中,第一个是3x3的无padding和strides的普通卷积示意,第2个是3x3的d=2的无padding和strides的膨胀卷积示意,两者的参数是一样的,普通卷积的接受野是3x3而膨胀卷积的接受野是5x5.

以二维图像为例(假设两个维度上的参数都一样),设输入的尺寸为i, 卷积核的大小为k, stride的大小为s, p为zero padding的大小, 这时普通卷积的输出大小为。 而对于卷积核大小为k, 膨胀因子为d的膨胀卷积的有效尺寸为, 所以膨胀卷积的输出大小为

膨胀卷积相比于普通卷积的优点在于不增加卷积核的大小就可以实现感受野的增加,正如前面例子示意的那样。而当多个卷积层堆叠在一起的时候,膨胀卷积可以实现感受野的指数级增加(从而减少了参数量)。

在论文Understanding Convolution for Semantic Segmentation中提到膨胀卷积的缺点是如果在多层膨胀卷积的膨胀率一样时会导致"网格化"现象,造成信息的丢失;论文中提到的解决办法是在每层中使用不同的膨胀率。(下图来自论文)

参考资料:

  1. 文中的gif图源自

  1. Fisher Yu and Vladlen Koltun. “Multi-Scale Context Aggregation by Dilated Convolutions” arXiv: Computer Vision and Pattern Recognition(2015): n. pag.

  1. Panqu Wang et al. “Understanding Convolution for Semantic Segmentation” Workshop on Applications of Computer Vision(2018): n. pag.

更多推荐

膨胀卷积(DILATED CONVOLUTIONS)

本文发布于:2023-06-28 13:40:44,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/928306.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:卷积   DILATED   CONVOLUTIONS

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!