2.卷积神经网络(CNN)

编程入门行业动态更新时间:2024-10-18 18:28:31

2.<a href=https://www.elefans.com/category/jswz/34/1765938.html style= 卷积神经网络(CNN)"/>

2.卷积神经网络(CNN)

一句话引入： 如果我们要做图像识别，用的是一个200x200的图片，那么BP神经网络的输入层就需要40000个神经元，因为是全连接，所以整个BP神经网络的参数量就是160亿个，显然不能这样来训练网络，所以我们就需要在输入层之前，加入一个处理图片的操作，而这个操作的目的，
1.为了把图片的特征提取出来，减去没有必要的噪音。
2.降低矩阵的参数数量。
然后再输入到BP神经网络中去训练权重和偏置量。

1.感受野：

人的眼睛看见东西，不是一个神经元就能做到的，而是很多个神经元，每个神经元只负责自己的那块局部信息，而很多个神经元组合而成，就成了我们可以看见的图像。

2.卷积运算：

卷积运算，是用来提取图片中的特征的，一次卷积运算的过程，就是使用一个卷积核，对整个图像进行一次运算，不同的卷积核，可以提取出来不同的特征，比如直线，曲线。卷积运算如下图：

这实际上就是两个矩阵相乘求和的结果。卷积核会根据步长来顺着对图片矩阵进行一次卷积运算，假如步长为1，那么下一步就如下图：

其中不同的卷积核，可以提取出不同的图片特征，可以理解为，有些卷积核是用来提取猪耳朵，有些来提取猪鼻子。
Padding： 所谓的padding操作，实际上就是在图片边缘，上下左右补0，目的就是为了可以获取图片的边缘特征。