计算机视觉与人类视觉
正如上图所示,我们在谈论任何类型的神经网络时,都不可能不提及一点神经科学以及人体(特别是大脑)及其功能相关的知识,这些知识成为创建各种深度学习模型的主要灵感的来源。
卷积神经网络的架构:
卷积神经网络架构
如上图所示,卷积神经网络架构与常规人工神经网络架构非常相似,特别是在网络的最后一层,即全连接。此外,还注意到卷积神经网络能够接受多个特征图作为输入,而不是向量。
下面让我们探索构成卷积神经网络的基本构件及相关的数学运算过程,并根据在训练过程中学到的特征和属性对图像进行可视化和分类。
输入层|Input Layer:
输入层主要是n×m×3 RGB图像,这不同于人工神经网络,人工神经网络的输入是n×1维的矢量。
RGB图像
卷积层|Convolution Layer:
在卷积层中,计算输入图像的区域和滤波器的权重矩阵之间的点积,并将其结果作为该层的输出。滤波器将滑过整个图像,重复相同的点积运算。这里注意两件事:
- 滤波器必须具有与输入图像相同数量的通道;
- 网络越深,使用的滤波器就越多;拥有的滤波器越多,获得的边缘和特征检测就越多;
前向卷积运算
卷积层输出的尺寸:
输出宽度: