1.1.1 MNIST 数据集简介

在MNIST数据集介绍的官网(http://yann.lecun.com/exdb/mnist/)中可知,原始的MNIST数据集共包含4个文件,见表1-1。

表1-1 原始的MNIST数据集包含的文件

在MNIST数据集中有两类图像:一类是训练集,对应着文件train-images-idx3-ubyte.gz和train-labels-idx1-ubyte.gz ;另一类是测试集,对应着文件t10k-images-idx3-ubyte.gz和t10k-labels-idx1-ubyte.gz。在数量上,训练集一共有60000张图像,而测试集有10000张图像。我们可以通过自行下载数据集,然后在Python中打开并进行处理,也可以利用PyTorch中定义好的包进行下载导入并处理。