深度学习的mnist手写数字数据集识别方式(准确率99%,附代码)-kb88凯时官网登录

来自：网络

时间：2024-08-28

阅读：

1.mnist数据集介绍

1.1 基本介绍

mnist数据集可以算是学习深度学习最常用到的了。

这个数据集包含70000张手写数字图片，分别是60000张训练图片和10000张测试图片，训练集由来自250个不同人手写的数字构成，一般来自高中生，一半来自工作人员，测试集（test set）也是同样比例的手写数字数据，并且保证了测试集和训练集的作者不同。

每个图片都是2828个像素点，数据集/会把一张图片的数据转成一个2828=784的一维向量存储起来。

里面的图片数据如下所示，每张图是0-9的手写数字黑底白字的图片，存储时，黑色用0表示，白色用0-1的浮点数表示。

1.2 数据集下载

1）d88尊龙官网手机app官网下载

mnist数据集的下载地址如下：

打开后会有四个文件：

训练数据集：train-images-idx3-ubyte.gz
训练数据集标签：train-labels-idx1-ubyte.gz
测试数据集：t10k-images-idx3-ubyte.gz
测试数据集标签：t10k-labels-idx1-ubyte.gz

将这四个文件下载后放置到需要用的文件夹下即可不要解压！下载后是什么就怎么放！

2）代码导入

文件夹下运行下面的代码，即可自动检测数据集是否存在，若没有会自动进行下载，下载后在这一路径：

# 下载数据集
from torchvision import datasets, transforms
train_set = datasets.mnist("data",train=true,download=true, transform=transforms.totensor(),)
test_set = datasets.mnist("data",train=false,download=true, transform=transforms.totensor(),)

参数解释：

datasets.mnist：是pytorch的内置函数torchvision.datasets.mnist，可以导入数据集
train=true ：读入的数据作为训练集
transform：读入我们自己定义的数据预处理操作
download=true：当我们的根目录（root）下没有数据集时，便自动下载

如果这时候我们通过联网自动下载方式download我们的数据后，它的文件路径是以下形式：原文件夹/data/mnist/raw

2.代码部分

2.1文件夹目录

test：自己写的测试图片
main:主函数
model:训练的模型参数，会自动生成
data:数据集文件夹 2.2 运行结果

14轮左右，模型识别准确率达到99%以上

2.3代码

1）导入必要的包及预处理

本人学习时做了较多注释，且用的是下载好的文件，如果是自己的请更改对应的文件目录哦。

import os
import matplotlib.pyplot as plt
import torch
from pil import image
from torch import nn
from torch.nn import conv2d, linear, relu
from torch.nn import maxpool2d
from torchvision import transforms
from torchvision.datasets import mnist
from torch.utils.data import dataloader
# dataset:创建数据集的函数；__init__:初始化数据内容和标签
# __geyitem:获取数据内容和标签
# __len__:获取数据集大小
# daataloader:数据加载类，接受来自dataset已经加载好的数据集
# torchbision:图形库，包含预训练模型，加载数据的函数、图片变换，裁剪、旋转等
# torchtext:处理文本的工具包，将不同类型的额文件转换为datasets
# 预处理：将两个步骤整合在一起
transform = transforms.compose({
    transforms.totensor(),  # 将灰度图片像素值（0~255）转为tensor（0~1），方便后续处理
    # transforms.normalize((0.1307,),(0.3081)),    # 归一化，均值0，方差1;mean:各通道的均值std：各通道的标准差inplace：是否原地操作
})

2）加载数据集

# 加载数据集
# 训练数据集
train_data = mnist(root='./data', train=true, transform=transform, download=true)
train_loader = dataloader(dataset=train_data, batch_size=64, shuffle=true)
# transform：指示加载的数据集应用的数据预处理的规则，shuffle：洗牌，是否打乱输入数据顺序
# 测试数据集
test_data = mnist(root="./data", train=false, transform=transform, download=true)
test_loader = dataloader(dataset=test_data, batch_size=64, shuffle=true)
train_data_size = len(train_data)
test_data_size = len(test_data)
print("训练数据集的长度：{}".format(train_data_size))
print("测试数据集的长度：{}".format(test_data_size))

3）构建模型

成功运行的话请给个免费的赞吧！（调试不易）

模型主要由两个卷积层，两个池化层，以及三个全连接层构成，激活函数使用relu.

class mnistmodel(nn.module):
    def __init__(self):
        super(mnistmodel, self).__init__()
        self.conv1 = conv2d(in_channels=1, out_channels=10, kernel_size=5, stride=1, padding=0)
        self.maxpool1 = maxpool2d(2)
        self.conv2 = conv2d(in_channels=10, out_channels=20, kernel_size=5, stride=1, padding=0)
        self.maxpool2 = maxpool2d(2)
        self.linear1 = linear(320, 128)
        self.linear2 = linear(128, 64)
        self.linear3 = linear(64, 10)
        self.relu = relu()
    def forward(self, x):
        x = self.relu(self.maxpool1(self.conv1(x)))
        x = self.relu(self.maxpool2(self.conv2(x)))
        x = x.view(x.size(0), -1)
        x = self.linear1(x)
        x = self.linear2(x)
        x = self.linear3(x)
        return x
# 损失函数crossentropyloss
model = mnistmodel()#实例化
criterion = nn.crossentropyloss()   # 交叉熵损失，相当于softmax log nllloss
# 线性多分类模型softmax,给出最终预测值对于10个类别出现的概率，log:将乘法转换为加法，减少计算量，保证函数的单调性
# nllloss:计算损失，此过程不需要手动one-hot编码，nllloss会自动完成
# sgd，优化器，梯度下降算法e
optimizer = torch.optim.sgd(model.parameters(), lr=0.14)#lr:学习率

4）模型训练

每次训练完成后会自动保存参数到pkl模型中，如果路径中有pkl文件，下次运行会自动加载上一次的模型参数，在这个基础上继续训练，第一次运行时没有模型参数，结束后会自动生成。

# 模型训练
def train():
    # index = 0
    for index, data in enumerate(train_loader):#获取训练数据以及对应标签
        # for data in train_loader:
       input, target = data   # input为输入数据，target为标签
       y_predict = model(input) #模型预测
       loss = criterion(y_predict, target)
       optimizer.zero_grad() #梯度清零
       loss.backward()#loss值反向传播
       optimizer.step()#更新参数
       # index  = 1
       if index % 100 == 0: # 每一百次保存一次模型，打印损失
           torch.save(model.state_dict(), "./model/model.pkl")   # 保存模型
           torch.save(optimizer.state_dict(), "./model/optimizer.pkl")
           print("训练次数为：{}，损失值为：{}".format(index, loss.item() ))

5）加载模型

第一次运行这里需要一个空的model文件夹

# 加载模型
if os.path.exists('./model/model.pkl'):
   model.load_state_dict(torch.load("./model/model.pkl"))#加载保存模型的参数

6）模型测试

# 模型测试
def test():
    correct = 0     # 正确预测的个数
    total = 0   # 总数
    with torch.no_grad():   # 测试不用计算梯度
        for data in test_loader:
            input, target = data
            output = model(input)   # output输出10个预测取值，概率最大的为预测数
            probability, predict = torch.max(input=output.data, dim=1)    # 返回一个元祖，第一个为最大概率值，第二个为最大概率值的下标
            # loss = criterion(output, target)
            total  = target.size(0)  # target是形状为（batch_size,1)的矩阵，使用size（0）取出该批的大小
            correct  = (predict == target).sum().item()  # predict 和target均为（batch_size,1)的矩阵，sum求出相等的个数
        print("测试准确率为：%.6f" %(correct / total))

7）自己手写数字图片识别函数（可选用）

这部分主要是加载训练好的pkl模型测试自己的数据，因此在进行自己手写图的测试时，需要有训练好的pkl文件，并且就不要调用train()函数和test()函数啦

注意：这个图片像素也要说黑底白字，28*28像素，否则无法识别

def test_mydata():
    image = image.open('./test/test_two.png')   #读取自定义手写图片
    image = image.resize((28, 28))   # 裁剪尺寸为28*28
    image = image.convert('l')  # 转换为灰度图像
    transform = transforms.totensor()
    image = transform(image)
    image = image.resize(1, 1, 28, 28)
    output = model(image)
    probability, predict = torch.max(output.data, dim=1)
    print("此手写图片值为：%d,其最大概率为：%.2f " % (predict[0], probability))
    plt.title("此手写图片值为：{}".format((int(predict))), fontname='simhei')
    plt.imshow(image.squeeze())
    plt.show()

8）mnist中的数据识别测试数据

训练过程中的打印信息我进行了修改，这里设置的训练轮数是15轮，每次训练生成的pkl模型参数也是会更新的，想要更多训练信息可以查看对应的教程哦~

#测试识别函数
if __name__ == '__main__':
    #训练与测试
    for i in range(15):#训练和测试进行15轮
        print({"————————第{}轮测试开始——————".format (i   1)})
        train()
        test(）

9）测试自己的手写数字图片（可选）

这部分主要是与tset_mydata()函数结合，加载训练好的pkl模型测试自己的数据，因此在进行自己手写图的测试时，需要有训练好的pkl文件，并且就不要调用train()函数和test()函数啦。

注意：这个图片像素也要说黑底白字，28*28像素，否则无法识别

# 测试主函数
if __name__ == '__main__':
    test_mydata()

将所有代码按顺序放到编辑器中，安装好对应的包，就可以顺利运行啦。

完整代码放下面：

import os
import matplotlib.pyplot as plt
import torch
from pil import image
from torch import nn
from torch.nn import conv2d, linear, relu
from torch.nn import maxpool2d
from torchvision import transforms
from torchvision.datasets import mnist
from torch.utils.data import dataloader
# dataset:创建数据集的函数；__init__:初始化数据内容和标签
# __geyitem:获取数据内容和标签
# __len__:获取数据集大小
# daataloader:数据加载类，接受来自dataset已经加载好的数据集
# torchbision:图形库，包含预训练模型，加载数据的函数、图片变换，裁剪、旋转等
# torchtext:处理文本的工具包，将不同类型的额文件转换为datasets
# 预处理：将两个步骤整合在一起
transform = transforms.compose({
    transforms.totensor(),  # 将灰度图片像素值（0~255）转为tensor（0~1），方便后续处理
    # transforms.normalize((0.1307,),(0.3081)),    # 归一化，均值0，方差1;mean:各通道的均值std：各通道的标准差inplace：是否原地操作
})
# normalize执行以下操作：image=(image-mean)/std?????
# input[channel] = (input[channel] - mean[channel]) / std[channel]
# 加载数据集
# 训练数据集
train_data = mnist(root='./data', train=true, transform=transform, download=true)
train_loader = dataloader(dataset=train_data, batch_size=64, shuffle=true)
# transform：指示加载的数据集应用的数据预处理的规则，shuffle：洗牌，是否打乱输入数据顺序
# 测试数据集
test_data = mnist(root="./data", train=false, transform=transform, download=true)
test_loader = dataloader(dataset=test_data, batch_size=64, shuffle=true)
train_data_size = len(train_data)
test_data_size = len(test_data)
print("训练数据集的长度：{}".format(train_data_size))
print("测试数据集的长度：{}".format(test_data_size))
# print(test_data)
# print(train_data)
class mnistmodel(nn.module):
    def __init__(self):
        super(mnistmodel, self).__init__()
        self.conv1 = conv2d(in_channels=1, out_channels=10, kernel_size=5, stride=1, padding=0)
        self.maxpool1 = maxpool2d(2)
        self.conv2 = conv2d(in_channels=10, out_channels=20, kernel_size=5, stride=1, padding=0)
        self.maxpool2 = maxpool2d(2)
        self.linear1 = linear(320, 128)
        self.linear2 = linear(128, 64)
        self.linear3 = linear(64, 10)
        self.relu = relu()
    def forward(self, x):
        x = self.relu(self.maxpool1(self.conv1(x)))
        x = self.relu(self.maxpool2(self.conv2(x)))
        x = x.view(x.size(0), -1)
        x = self.linear1(x)
        x = self.linear2(x)
        x = self.linear3(x)
        return x
# 损失函数crossentropyloss
model = mnistmodel()#实例化
criterion = nn.crossentropyloss()   # 交叉熵损失，相当于softmax log nllloss
# 线性多分类模型softmax,给出最终预测值对于10个类别出现的概率，log:将乘法转换为加法，减少计算量，保证函数的单调性
# nllloss:计算损失，此过程不需要手动one-hot编码，nllloss会自动完成
# sgd，优化器，梯度下降算法e
optimizer = torch.optim.sgd(model.parameters(), lr=0.14)#lr:学习率
# 模型训练
def train():
    # index = 0
    for index, data in enumerate(train_loader):#获取训练数据以及对应标签
        # for data in train_loader:
       input, target = data   # input为输入数据，target为标签
       y_predict = model(input) #模型预测
       loss = criterion(y_predict, target)
       optimizer.zero_grad() #梯度清零
       loss.backward()#loss值反向传播
       optimizer.step()#更新参数
       # index  = 1
       if index % 100 == 0: # 每一百次保存一次模型，打印损失
           torch.save(model.state_dict(), "./model/model.pkl")   # 保存模型
           torch.save(optimizer.state_dict(), "./model/optimizer.pkl")
           print("训练次数为：{}，损失值为：{}".format(index, loss.item() ))
# 加载模型
if os.path.exists('./model/model.pkl'):
   model.load_state_dict(torch.load("./model/model.pkl"))#加载保存模型的参数
# 模型测试
def test():
    correct = 0     # 正确预测的个数
    total = 0   # 总数
    with torch.no_grad():   # 测试不用计算梯度
        for data in test_loader:
            input, target = data
            output = model(input)   # output输出10个预测取值，概率最大的为预测数
            probability, predict = torch.max(input=output.data, dim=1)    # 返回一个元祖，第一个为最大概率值，第二个为最大概率值的下标
            # loss = criterion(output, target)
            total  = target.size(0)  # target是形状为（batch_size,1)的矩阵，使用size（0）取出该批的大小
            correct  = (predict == target).sum().item()  # predict 和target均为（batch_size,1)的矩阵，sum求出相等的个数
        print("测试准确率为：%.6f" %(correct / total))
#测试识别函数
if __name__ == '__main__':
    #训练与测试
    for i in range(15):#训练和测试进行5轮
        print({"————————第{}轮测试开始——————".format (i   1)})
        train()
        test()
def test_mydata():
    image = image.open('./test/test_two.png')   #读取自定义手写图片
    image = image.resize((28, 28))   # 裁剪尺寸为28*28
    image = image.convert('l')  # 转换为灰度图像
    transform = transforms.totensor()
    image = transform(image)
    image = image.resize(1, 1, 28, 28)
    output = model(image)
    probability, predict = torch.max(output.data, dim=1)
    print("此手写图片值为：%d,其最大概率为：%.2f " % (predict[0], probability))
    plt.title("此手写图片值为：{}".format((int(predict))), fontname='simhei')
    plt.imshow(image.squeeze())
    plt.show()
# 测试主函数
# if __name__ == '__main__':
#     test_mydata()

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持。

目录 python 日期和时间戳的转换 python中处理时间的模块 python的time模块将时间戳转换为格式化字符串 python 的datetime模块 datetime模块中定义的类（这些

2024-10-20 21:50:48

目录 1. 异步组件 1.1 使用 defineasynccomponent 1.2 预加载 2. 路由懒加载 3. 动态组件 4. 事件触发的动态加载 5. 按需加载与状态管理结合结论 1. 异步组

2024-10-20 21:50:41

目录引言使用python保存ppt中的所有形状为图像文件用python保存ppt中带格式设计的图片为图像文件引言将powerpoint演示文稿中的形状（幻灯片中的内容元素，包括文本框、图形

2024-10-20 21:50:28

目录前言用python删除pdf文档页边距前言在处理pdf文档时，有时候我们会遇到pdf文件带有较大的页边距的情况。这样过大的页边距不仅浪费了页面空间，而且在打印或电子阅读时也

2024-10-20 21:50:20

目录 1.引言 2.准备工作 3.基础理论知识 4.步骤详解 5.常见问题解答 6.成果案例分享 7.案例代码示例1.引言火柴人（stick figure）是一种极简风格的图形，通常由简单的线段和圆圈

2024-10-20 21:50:09

目录环境介绍类和函数区别封装性：状态保持：可重用性：继承和多态：设计模式：代码组织：执行流程：参数传递：返回值：上下文管理：总结环境window10，pyc

2024-10-20 21:50:03

目录一、jwt的介绍二、jwt的组成 1、header（头部） 2、payload（负载） 3、signature（签名）三、python写jwt 1、安装jwt 2、使用jwt 3、解密jwt 总结一、jwt的介绍jw

2024-10-18 23:10:58

目录视频转换成 gif 图形的重要性 1. 增强表达效果 2. 适应性强 3. 文件大小优化 4. 易于创建和编辑 5. 吸引用户注意力 6. 简化获取信息的步骤用python实现视gif

2024-10-18 23:10:46

目录前言 1. 构建分子式 2. 判断化合价 3. 解析分子式 4. 化合物反应方程式平衡 5. 化合物的摩尔质量计算 6. 计算化合物的质量分数 7. 计算反应热 8. 计算化合物的ph值总

2024-10-18 23:10:16

目录 1 创建 pytest.ini 文件 2 常见参数及配置方法 3 高级配置 4 结论1 创建 pytest.ini 文件在项目的根目录下，创建一个名为 pytest.ini 的文件即可。pytest 会在执行测试

2024-10-18 23:10:06

目录一、xpath概念二、常用规则与方法 1.f12例子: 2.节点获取文本 3.属性匹配 4. 属性获取 5.iframe标签处理三、同级节点元素定位四、关键字定位五、定位

2024-10-18 23:09:49

目录引言发送get请求获取页面的二进制数据添加查询参数发送post请求处理json数据设置自定义header 发送带认证信息的请求发送带有表单数据的请求发送带有文件的请

2024-10-18 23:09:30

安装cpu版本：(以2.9.0版本为例)pip install tensorflow==2.9.0安装gpu版本：(以2.9.0版本为例)pip install tensorflow-gpu==2.9.0若下载缓慢，使用阿里国内镜像源加速下载：(以2.9

2024-10-14 19:47:12

目录概述用asyncio实现hello world 总结概述python中 asyncio 模块内置了对异步io的支持，用于处理异步io；是python 3.4版本引入的标准库。asyncio 的编程模型就是一个消息循

2024-10-14 19:47:02

目录 1. 问题描述 2. 解决办法 2.1 办法一：进入script 进行安装 2.2 办法二：设置环境变量总结 1. 问题描述这几天一直用python实战，今天用pip想要安装一个库，结果突然报了

2024-10-14 19:46:53

目录实践环境问题域定义协议格式(编写proto文件) 编译协议缓冲区协议缓冲区 api 枚举标准消息方法解析和序列化编写消息读取消息另一个示例参考链接

2024-10-14 19:46:35

目录使用pip时报nameerror: name‘pip’is not defined错误 1. 问题描述 2. 解决办法总结使用pip时报nameerror: name‘pip’is not defined错

2024-10-14 19:46:27

目录 1. 概述 2. arange() 2.1 语法 2.2 参数 2.3 实例总结 1. 概述numpy 中 arange() 主要是用于生成数组，具体用法如下；2. arange()2.1 语法numpy.arange(start, sto

2024-10-14 19:46:12

目录 1. 概述 2. vstack() 2.1 语法 2.2 参数 2.3 实例 3. hstack() 3.1 语法 3.2 参数 3.3 实例总结 1. 概述在numpy中，最希望处理的数据就是数组和矩阵，下面就

2024-10-14 19:46:03

目录 python列表简介 numpy数组简介性能比较 1. 数组操作 2. 循环操作内存使用比较 1. 内存占用 2. 大数据集结论在python中，处理数值数据时，我们通常面临两种选

2024-10-14 19:45:55

目录引言基础语法介绍核心概念基本语法规则基础实例问题描述代码示例进阶实例问题描述高级代码实例实战案例问题描述 kb88凯时官网登录的解决方案代码实现扩展

2024-10-14 19:45:46

目录引言 python excel库 python 在excel 中的添加数据条引言在excel中添加数据条是一种数据可视化技巧，它通过条形图的形式在单元格内直观展示数值的大小，尤其适合比较同一

2024-10-14 19:45:37

目录

一、引言

二、什么是查询集？

2.1 创建查询集

三、查询集的延迟加载

3.1 查询集的惰性行为

2024-10-14 19:44:53

字符串问题我正在使用 python 通过 jdbc（或 odbc）访问 iris 数据库。我想将数据提取到 pandas 数据框中来操作数据并从中创建图表。我在使用 jdbc 时遇到了字符串处理问题。

2024-09-30 00:07:53

您的组织是否拥有太多 github 存储库，并且您需要一种简单的方法来总结和记录每个存储库的内容以用于报告、仪表板或审计目的？下面是一个使用 github api 完成该操作的快速脚本

2024-09-30 00:07:10

python构建代理池构建有效的代理池对于爬虫任务至关重要，因为它可以绕过网站反爬或提升爬虫效率。在python中构建代理池的方法如下：一、收集代理免费代理网站：如freeproxylist

2024-09-18 16:06:35

本文介绍基于python语言，针对一个文件夹下大量的excel表格文件，对其中的每一个文件加以操作——将其中指定的若干列的数据部分都向上移动一行，并将所有

2024-09-09 23:42:47

技术背景一般情况下我们会选择使用明文形式来存储数据，如json、txt、csv等等。如果是需要压缩率较高的存储格式，还可以选择使用hdf5或者npz等格式。还有一种比较紧凑的数据存

2024-09-09 23:40:42

要将阿拉伯数字转换成中国汉字表示的数字，我们需要一个映射表来转换每个数字，并且处理不同位数的数字（如十、百、千、万等）。1. python实现阿拉伯数字转换成中国汉字下面是一个

2024-09-09 23:40:16

目录一、问题描述二、问题解决一、问题描述笔者在使用opencv读取带有中文路径的图片时，发现会出现乱码的情况。具体问题如下：# 读取带有中文路径的图片出现错误import cv2img_

2024-08-28 10:54:27

2020-10-21

2021-03-02

2020-05-07

2020-05-26

2021-01-13

2021-04-02

2020-05-10

2020-05-09

2020-05-10

2020-10-21

深度学习的mnist手写数字数据集识别方式(准确率99%,附代码)-kb88凯时官网登录

目录

1.mnist数据集介绍

1.1 基本介绍

1.2 数据集下载

2.代码部分

2.1文件夹目录

2.3代码

总结

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道