【深度学习基础】Pytorch框架CV开发（2）实战篇

编程入门行业动态更新时间:2024-10-21 11:36:54

【深度学习基础】Pytorch<a href=https://www.elefans.com/category/jswz/34/1770644.html style= 框架CV开发（2）实战篇"/>

【深度学习基础】Pytorch框架CV开发（2）实战篇

📢：如果你也对机器人、人工智能感兴趣，看来我们志同道合✨
📢：不妨浏览一下我的博客主页【】
📢：文章若有幸对你有帮助，可点赞 👍 收藏 ⭐不迷路🙉
📢：内容若有错误，敬请留言 📝指正！原创文，转载请注明出处

文章目录

人工神经网络识别手写数字
使用卷积神经网络识别手写数字
ONNX模型导出与推理

人工神经网络识别手写数字

Mnist数据集介绍：MNIST数据集是一个入门级的计算机视觉数据集，可以广泛应用于机器学习的训练和测试。它包含各种尺寸是28*28的手写数字图片，其中有60000个训练样本集和10000个测试样本集。这个数据集是由来自250个不同人手写的数字构成的，一般来自高中生和工作人员，保证了其多样性。每张图片都是二进制存储，格式为灰度图像，其标签是1×784的数字出现概率。

构建识别数字手写体的人工神经网络

其中，隐藏层一共100个结点（神经元），输出层一共10个结点，代表10个类别。输入一共784个像素点。
模型训练过程的设置
1.超参数设置：主要是批次和学习率。
2.优化器的选择：求梯度的方法选择，更新参数更好。
3.训练epoch：所有数据训练完一次就是一个epoch。
模型训练代码解读：

模型测试代码解读：

模型加载也可以理解为模型推理。
预测和推理时候的数据输入格式要跟训练的时候保持一致。也就是说两者对图像的预处理方式要完全相同。

模型保存方式：一共两种。
方法1：Torch.save(model,path);
方法2：Torch.save(model.state_dict(),path)
☆第二种方法相比第一种保存了模型的参数。推荐使用第二种。

模型加载方式：一共两种。
方法1：对应保存模型的方法1
model=torch.load(path)
Model.eval()
方法2：对应保存模型的方法2，用于加载保存了参数的模型。
model=model.load_state_dict(torch.load(path))
Model.eval()

eval函数的作用：网络的某些层（dropout / bn）在训练时候需要用到，但是在测试的时候需要修改一些参数才能预测准确，而修改参数就是这个eval函数的作用。

使用卷积神经网络识别手写数字

网络结构构建卷积神经网络来识别手写数字，其网络结构如下图所示：由卷积层、池化层、激活函数和全连接层组成。

解读网络结构图：

weighut(8x1x3x3)表示输入图像为单通道，因此卷积核也是单通道，大小为3X3。一共8个卷积核，因此输出8张特征图，理解为8通道。Bias(8)表示每个卷积核携带一个偏置，一共八个。
weighut(32x8x3x3)表示输入图像是8通道的，因此需要八通道的卷积核来过滤，大小为3X3。一共32个卷积核，因此输出32张特征图，理解为32通道。Bias(32)表示每个卷积核携带一个偏置，一共32个。
经过上述的操作后生成7X7（尺寸）X32（通道数）的特征图，作为全连接层的输入。第一个全连接层输出200个参数，经过激活函数后；进入第二个全连接层，输出100个参数，再次经过激活函数；进入第三个全连接层，输出10个参数，也就是通过logsoftmax判断这个输入数字跟0-9之间的置信度，越高说明越接近这个真实值。

根据结构图编写代码

对所构建的模型进行训练与测试
1.选择损失函数：交叉熵损失函数
2.选择优化器：Adam 关于优化器的选择问题，目前证明Adam的效果要比SGD的要好。
3.模型训练：选择使用GPU
4.模型保存
5.模型加载和测试

ONNX模型导出与推理

ONNX简介：模型一般保存为pt或是pth格式，而其他深度学习框架的格式又有所不同，因此为了部署的时候可以使用通用的格式，推出了ONNX格式。
因此需要将Pytorch模型转换为ONNX格式，也就是pt或是pth格式转换为ONNX格式 ONNX介绍：ONNX，全称Open Neural Network Exchange，即开放神经网络交换，是一个开放的生态系统。它使人工智能开发人员在推进项目时能够自由选择工具，不会受到特定框架或生态系统的限制。ONNX本质上是一种针对机器学习所设计的开放式的文件格式，主要用于存储训练好的模型。其核心作用在于为不同的深度学习框架（如Pytorch,
MXNet等）提供一个共同的中间表示格式，使得这些框架可以进行模型之间的转换。

ONNX格式在opencv和openvino上都可以运行。

ONNX格式模型转换方法
例如：

首先，使用load_state_dict（状态字典）函数加载模型。
然后，使用torch.onnx.export函数进行转换。
注意在转换函数中需要填入第二个参数，这个参数要求格式为输入图像跟训练时一样，也就是1X1X28X28。并且是张量数据类型。
第三个参数是转换后的模型名称。
ONNX格式模型在opencv中使用

思考感悟 反思卷积神经网络比人工神经网络的优越性：人工神经网络工作前提通过全像素提取特征，然后多层感知机进行分类。卷积神经网络通过卷积提取特征，然后使用全连接层进行分类。卷积层提取特征的能力要比人工神经网络好很多。卷积核的通道数越多，能力越强。
模型转换过程中，一定要先执行eval()，才能正确导出。