计算机系统应用教程网站

网站首页 > 技术文章 正文

Day129:图像卷积和池化操作后的特征图大小计算方法

btikc 2024-09-16 12:57:32 技术文章 24 ℃ 0 评论

一,卷积操作

若图像为正方形:设输入图像尺寸为WxW,卷积核尺寸为FxF,步幅为S,Padding使用P,经过该卷积层后输出的图像尺寸为NxN:

若图像为矩形:设输入图像尺寸为WxH,卷积核的尺寸为FxF,步幅为S,图像深度(通道数)为C,Padding使用P,则卷积后输出图像大小:

注意:Padding的作用用于解决图像边缘信息损失的问题

same:(same模式只有步长为1时,输入和输出的尺度才相同)

输入特征图为5x5,卷积核为3x3,外加padding 为1,则其输出尺寸为 :

二,池化操作

设输入图像尺寸为WxH,其中W:图像宽,H:图像高,D:图像深度(通道数),卷积核的尺寸为FxF,S:步长,池化后输出图像大小:

池化后输出图像深度为D

当进行池化操作时,步长S就等于池化核的尺寸,如输入为24x24,池化核为4x4,则输出为(24-4)/4+1=6

若除不尽,则取较小的数,如池化核为7x7,则输出为(24-7)/7+1=3.428=3,不是用四舍五入,就是取最小的整数,即使为3.9,也是 取3

三,空洞卷积(也称扩张卷积,膨胀卷积)--dilated convolution


其中 d为空洞卷积的空洞率(正常的卷积d=1),p为padding,k为kernel size

举个例子:

下面的空洞卷积核是d=2,k=2的空洞卷积卷积核。

当d=2,k=2时,-d(k-1)-1 = -3,即相当于 一个k=3的正常卷积核。下图的正好是3x3的。

https://blog.csdn.net/u014453898/article/details/85126733

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表