一,卷积操作
若图像为正方形:设输入图像尺寸为WxW,卷积核尺寸为FxF,步幅为S,Padding使用P,经过该卷积层后输出的图像尺寸为NxN:
若图像为矩形:设输入图像尺寸为WxH,卷积核的尺寸为FxF,步幅为S,图像深度(通道数)为C,Padding使用P,则卷积后输出图像大小:
注意:Padding的作用用于解决图像边缘信息损失的问题
same:(same模式只有步长为1时,输入和输出的尺度才相同)
输入特征图为5x5,卷积核为3x3,外加padding 为1,则其输出尺寸为 :
二,池化操作
设输入图像尺寸为WxH,其中W:图像宽,H:图像高,D:图像深度(通道数),卷积核的尺寸为FxF,S:步长,池化后输出图像大小:
池化后输出图像深度为D
当进行池化操作时,步长S就等于池化核的尺寸,如输入为24x24,池化核为4x4,则输出为(24-4)/4+1=6
若除不尽,则取较小的数,如池化核为7x7,则输出为(24-7)/7+1=3.428=3,不是用四舍五入,就是取最小的整数,即使为3.9,也是 取3
三,空洞卷积(也称扩张卷积,膨胀卷积)--dilated convolution
其中 d为空洞卷积的空洞率(正常的卷积d=1),p为padding,k为kernel size
举个例子:
下面的空洞卷积核是d=2,k=2的空洞卷积卷积核。
当d=2,k=2时,-d(k-1)-1 = -3,即相当于 一个k=3的正常卷积核。下图的正好是3x3的。
https://blog.csdn.net/u014453898/article/details/85126733
本文暂时没有评论,来添加一个吧(●'◡'●)