一篇卷积神经网络的编年史

雷锋网按：提起卷积神经网络你会想到什么？LeNet、AlexNet 还是 ResNet？它们之间有哪些差别和特点，又经历了怎样的发展和演变？本文将针对这一话题展开讨论。原文作者杨熹，载于作者的个人博客，雷锋网经授权发布。

人工神经网络模型整体上的发展过程如下图所示：

上图对比了本文所述的各种神经网络之间，操作复杂度和精度之间的关系。

LeNet5

1998， Yann LeCun 的 LeNet5。

图像特征分布在整个图像上。

在具有很少参数的多个位置上提取类似特征时，具有可学习的参数的卷积是个比较有效的方法。

在没有应用GPU的时候，能够保存参数和计算就成了一个关键优势。

LeNet5并没有把每个像素都作为大型多层神经网络的一个输入，因为图像是高度空间相关的，如果用了这种方法，就不能很好地利用相关性。

LeNet5 的主要特征：

CNN 主要用这3层的序列： convolution, pooling, non-linearity；
用卷积提取空间特征；
由空间平均得到子样本；
用 tanh 或 sigmoid 得到非线性；
用 multi-layer neural network（MLP）作为最终分类器；
层层之间用稀疏的连接矩阵，以避免大的计算成本。

Dan Ciresan Net

2010， Dan Claudiu Ciresan and Jurgen Schmidhuber 的 Dan Ciresan Net。

是比较早的GPU神经网络之一，在 NVIDIA GTX 280 图形处理器上实现了9层神经网络的前向后向计算。

AlexNet

2012，Alex Krizhevsky 的 AlexNet。

是LeNet的一个更深和更广的版本，可以用来学习更复杂的对象。

AlexNet 的主要特征：

用rectified linear units（ReLU）得到非线性；
使用辍 dropout 技巧在训练期间有选择性地忽略单个神经元，来减缓模型的过拟合；
重叠最大池，避免平均池的平均效果；
使用 GPU NVIDIA GTX 580 可以减少训练时间，这比用CPU处理快了 10 倍，所以可以被用于更大的数据集和图像上。

OverFeat

2013年12月，Yann LeCun的纽约大学实验室的 OverFeat。

是AlexNet的衍生，提出了 learning bounding boxes。

VGG

2015，牛津的 VGG。

率先在每个卷积层中使用更小的 3×3 filters，并将它们组合成卷积序列。

虽然小，但是多个3×3卷积序列可以模拟更大的接收场的效果。

这个想法也在最近的Inception和ResNet网络中有所应用。

NiN

2014，Min Lin, Qiang Chen, Shuicheng Yan 的 NiN。

它的思想很简单但是很有效，使用1x1卷积给一个卷积层的特征提供了更多的组合性。

每个卷积之后使用空间MLP层，以便在另一层之前更好地组合特征，而没有使用原始像素作为下一层的输入。

可以有效地使用非常少的参数，在这些特征的所有像素之间共享。

GoogLeNet and Inception

2014，Google Christian Szegedy 的 GoogLeNet and Inception。

在昂贵的并行块之前，使用1×1卷积块（NiN）来减少特征数量，这通常被称为“瓶颈”，可以减少深层神经网络的计算负担。

它用一个没有 inception modules 的 stem 作为初始层。

用类似于NiN的平均池加上softmax分类器。

Inception V3 (and V2)

2015年2月，Christian 团队的 Inception V2，2015年12月，Inception V3。

在每个池之前，增加 feature maps，构建网络时，仔细平衡深度和宽度，使流入网络的信息最大化。

当深度增加时，特征的数量或层的宽度也有所增加。

在下一层之前，增加每一层的宽度来增多特征的组合性。

尽量只使用3x3卷积。

ResNet

2015，Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun 的 ResNet。

这个网络绕过了2层，可以被看作一个小的分类器，或者一个NiN 。

这也是第一次训练了大于100甚至1000层的网络。

在每一层，通过使用更小output的1x1卷积来减少特征的数量，然后经过一个3x3 层，接着又是一个1x1卷积，这个方法可以保持少计算量，同时提供丰富的特征组合。

Xception

2016，Fran?ois Chollet 的 Xception。

这个网络和 ResNet and Inception V4 一样有效，而且用了更简单优雅的结构。

它有36个卷积阶段，和ResNet-34相似，不过模型和代码和ResNet一样简单，并且比Inception V4更易理解。

这个网络在 Torch7／Keras / TF 都已经可以应用了。

英文参考：

http://t.cn/R6V1ELT

雷锋网相关阅读：

YJango的卷积神经网络——介绍

杂谈CNN：如何通过优化求解输入图像

网站首页 > 技术文章正文

LeNet5

Dan Ciresan Net

AlexNet

OverFeat

VGG

GoogLeNet and Inception

ResNet

Xception

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎你发表评论:

网站首页 > 技术文章 正文

一篇卷积神经网络的编年史

LeNet5

Dan Ciresan Net

AlexNet

OverFeat

VGG

GoogLeNet and Inception

ResNet

Xception

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎 你 发表评论:

网站首页 > 技术文章正文

取消回复欢迎你发表评论: