利用BP神经网络设计一个三层神经网络解决手写数字的识别问题

程序员文章站 2022-05-21 23:53:19

...

文章目录

1. 题目描述
2. 求解原理

（1）算法模型
（2）算法原理

3.编程实现

（1）环境说明
（2）实验方案
（3）Python实现

1. 题目描述

设计一个三层神经网络解决手写数字的识别问题。
要求：
（1）三层神经网络如图：784-15-10结构
（2）使用随机梯度下降算法和MNIST训练数据。
http://yann.lecun.com/exdb/mnist/
利用BP神经网络设计一个三层神经网络解决手写数字的识别问题

2. 求解原理

（1）算法模型

利用BP神经网络，这里有输入层、隐藏层、输出层共三层，包括两个阶段，

第一阶段是输入信息的正向传播，其中隐藏层节点的输出为：

输出层节点的输出：
第二阶段是误差反向传播阶段
第p个样本的误差：

p个样本的总误差：

（2）算法原理

BP算法可以描述如下：
（1）工作信号正向传播：输入信号从输入层经隐藏层，传向输出层，在输出端产生输出信号，这是工作信号的正向传播。在信号的向前传递过程中网络的权值是固定不变的，每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出，则转入误差信号反向传播。正向传播的数学模型为：
利用BP神经网络设计一个三层神经网络解决手写数字的识别问题

其中n为样本数，w为权值，θ为偏置，

为**函数，这里选择sigmoid函数为**函数。
（2）误差信号反向传播：网络的实际输出与期望输出之间差值即为误差信号，误差信号由输出端开始逐层向前传播，这是误差信号的反向传播。在误差信号反向传播的过程中，网络的权值由误差反馈进行调节。通过权值的不断修正使网络的实际输出更接近期望输出。
在反向传播中，第p个样本的误差为：
利用BP神经网络设计一个三层神经网络解决手写数字的识别问题
p个样本的总误差：

梯度为：

其中：

3.编程实现

（1）环境说明

python3.7
tensorflow2.1.0

（2）实验方案

数据来源：
手写数字图片数据集MNIST，它包含了0-9共10种数字的手写图片，每种数字一共7000张图片，采样自不同书写风格的真实手写图片，一共70000张图片，其中60000张图片作为训练集，用来训练模型，剩下的10000图片作为测试集，用来预测或者测试，训练集和测试集共同组成了MNIST数据集。
考虑到手写数字图片包含的信息比较简单，每张图片均被缩放到28 × 28的大小，同时
只保留了灰度信息。这些图片由真人书写，包含了如字体大小、书写风格、粗细等丰富的样式，确保这些图片的分布与真实的手写数字图片的分布尽可能的接近，从而保证了模型的泛化能力。
实验计划和流程：
（1）网络搭建。搭建784-15-10结构的神经网络，**函数类型为 ReLU。
（2）模型训练。使用交叉熵作为损失函数。
验证和测试：
手写数字图片 MNIST 数据集的训练误差曲线如图所示，由于 3 层的神经网络表达能力较强，手写数字图片识别任务相对简单，误差值可以较快速、稳定地下降。其中，把对数据集的所有样本迭代一遍叫作一个Epoch，我们可以在间隔数个 Epoch 后测试模型的准确率等指标，方便监控模型的训练效果。
通过简单的 3 层神经网络，训练固定的 200 个 Epoch 后，我们在测试集上获得了91.59%的准确率。模型的训练误差曲线如图一所示，误差函数为交叉熵，其值越小，模型预测效果就越好。测试准确率曲线如图二所示。
如果使用复杂的神经网络模型，增加数据增强环节，精调网络超参数等技巧，可以获得更高的模型性能。
利用BP神经网络设计一个三层神经网络解决手写数字的识别问题

图一训练误差