Day129:图像卷积和池化操作后的特征图大小计算方法

btikc 2024-09-16 12:57:32 技术文章 24 ℃ 0 评论

一，卷积操作

若图像为正方形：设输入图像尺寸为WxW，卷积核尺寸为FxF，步幅为S，Padding使用P,经过该卷积层后输出的图像尺寸为NxN：

若图像为矩形：设输入图像尺寸为WxH，卷积核的尺寸为FxF，步幅为S，图像深度(通道数)为C，Padding使用P，则卷积后输出图像大小：

注意：Padding的作用用于解决图像边缘信息损失的问题

same：(same模式只有步长为1时，输入和输出的尺度才相同)

输入特征图为5x5，卷积核为3x3，外加padding 为1，则其输出尺寸为 :

设输入图像尺寸为WxH，其中W:图像宽，H:图像高，D:图像深度（通道数），卷积核的尺寸为FxF，S:步长，池化后输出图像大小：

池化后输出图像深度为D

当进行池化操作时，步长S就等于池化核的尺寸，如输入为24x24，池化核为4x4，则输出为（24-4）/4+1=6

若除不尽，则取较小的数，如池化核为7x7，则输出为（24-7）/7+1=3.428=3，不是用四舍五入，就是取最小的整数，即使为3.9，也是取3

其中 d为空洞卷积的空洞率（正常的卷积d=1），p为padding，k为kernel size

举个例子：

下面的空洞卷积核是d=2，k=2的空洞卷积卷积核。

当d=2，k=2时，-d(k-1)-1 = -3，即相当于一个k=3的正常卷积核。下图的正好是3x3的。

https://blog.csdn.net/u014453898/article/details/85126733