计算机系统应用教程网站

网站首页 > 技术文章正文

残差神经网络(ResNet)，一个大规模卷积神经网络

btikc 2024-09-09 01:41:53 技术文章 59 ℃ 0 评论

ResNet来自微软的人工智能团队Microsoft Research，是2015年ILSVRC图像分类和物体识别算法的优胜者，其表现超过了GoogLeNet的第三代版本Inception v3 。

ResNet是使用残差块建立的大规模卷积神经网络，其规模是AlexNet的20倍、VGG-16的8倍。

ResNet结构：在ResNet的原始版本中，其残差块由2个卷积层、1个跳跃连接、BN和激励函数组成，ResNet的隐含层共包含16个残差块，按如下方式构建：

(7×7)×3×64的卷积层（步长为2，无填充，ReLU，BN），3×3的极大池化（步长为2，相同填充）
3个残差块：3×3×64×64卷积层（步长为1，无填充，ReLU，BN），3×3×64×64卷积层（步长为1，无填充）
1个残差块：3×3×64×128（步长为2，无填充，ReLU，BN），3×3×128×128（步长为1，无填充，ReLU，BN）
3个残差块：3×3×128×128（步长为1，无填充，ReLU，BN），3×3×128×128（步长为1，无填充，ReLU，BN）
1个残差块：3×3×128×256（步长为2，无填充，ReLU，BN），3×3×256×256（步长为1，无填充，ReLU，BN）
5个残差块：3×3×256×256（步长为1，无填充，ReLU，BN），3×3×256×256（步长为1，无填充，ReLU，BN）
1个残差块：3×3×256×512（步长为2，无填充，ReLU，BN），3×3×512×512（步长为1，无填充，ReLU，BN）
2个残差块：3×3×512×512（步长为1，无填充，ReLU，BN），3×3×512×512（步长为1，无填充，ReLU，BN）
全局均值池化，1个全连接层，神经元数量为1000

ResNet受到关注的原因是其在隐含层中通过跳跃连接构建的残差块。残差块的堆叠缓解了深度神经网络普遍出现的梯度消失（gradient vanishing）问题，被其后的诸多算法使用，包括GoogLeNet中的Inception v4。

在ResNet的基础上诸多研究尝试了改进算法，包括预激活ResNet（preactivation ResNet）、宽ResNet（wide ResNet）、随机深度ResNets（Stochastic Depth ResNets, SDR）和RiR（ResNet in ResNet）等。预激活ResNet将激励函数和BN计算置于卷积核之前以提升学习表现和更快的学习速度；宽ResNet使用更多通道的卷积核以提升原ResNet的宽度，并尝试在学习中引入随机失活等正则化技术；SDR在学习中随机使卷积层失活并用等值函数取代以达到正则化的效果；RiR使用包含跳跃连接和传统卷积层的并行结构建立广义残差块，对ResNet进行了推广。上述改进算法都报告了比传统ResNet更好的学习表现，但尚未在使用基准数据的大规模比较，例如ILSVRC中得到验证。

上一篇： 26秒训练ResNet，单GPU准确率94%，这些奇技淫巧Jeff Dean都点赞
下一篇：普林斯顿、英特尔提出ParNet，速度和准确性显著优于ResNet

猜你喜欢

2024-09-09 TensorFlow2学习十六、实现ResNet(一)创建简单的ResNet模型
2024-09-09 「深度学习卷积神经网络」深不可测的残差网络ResNet模型
2024-09-09 LSTM之父再称ResNet、GAN等网络都有他的功劳，网友:自负>引用数
2024-09-09 腾讯开源业内最大多标签图像数据集，附ResNet-101模型
2024-09-09 人人都能18分钟训练完ImageNet了:低成本方法出世，只需40美元
2024-09-09 「24分钟训练完ImageNet创纪录」ResNet仅需120万美元挑战Facebook
2024-09-09 ResNet压缩20倍，Facebook提出新型无监督模型压缩量化方法
2024-09-09 SELU和ResNet(理论篇)|机器学习你会遇到的“坑”
2024-09-09 汇编级优化!网爆寒武纪Resnet50实测性能过万
2024-09-09 ResNet告诉我，我是不是世界上最美的人?

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎你发表评论:

最近发表