代码拉取完成,页面将自动刷新
同步操作将从 MindSpore/vision 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
此教程主要介绍MindVision中数据处理的接口,方便用户可以快速地对常用数据集进行数据加载和数据增强等操作。
我们示例中用到的MNIST数据集是由10类28∗28的灰度图片组成,训练数据集包含60000张图片,测试数据集包含10000张图片。
你可以从MNIST数据集下载页面下载,并按下方目录结构放置。MNIST数据集下载页面:http://yann.lecun.com/exdb/mnist/ 页面提供4个数据集下载链接,其中前2个文件是训练数据需要,后2个文件是测试结果需要。
在Jupyter Notebook中执行如下命令下载MNIST数据集。
!mkdir -p ./datasets/MNIST_Data/train ./datasets/MNIST_Data/test
!wget -NP ./datasets/MNIST_Data/train https://mindspore-website.obs.myhuaweicloud.com/notebook/datasets/mnist/train-labels-idx1-ubyte
!wget -NP ./datasets/MNIST_Data/train https://mindspore-website.obs.myhuaweicloud.com/notebook/datasets/mnist/train-images-idx3-ubyte
!wget -NP ./datasets/MNIST_Data/test https://mindspore-website.obs.myhuaweicloud.com/notebook/datasets/mnist/t10k-labels-idx1-ubyte
!wget -NP ./datasets/MNIST_Data/test https://mindspore-website.obs.myhuaweicloud.com/notebook/datasets/mnist/t10k-images-idx3-ubyte
!tree ./datasets/MNIST_Data
from mindvison.classification.dataset import create_mnist_dataset
create_mnist_dataset
函数对MNIST数据集进行了数据处理pipeline操作,其中包括数据加载、数据增强、数据混洗和数据分批等操作,参数如下:
data_path
:MNIST训练数据集或者测试数据集的路径。batch_size
:分批的大小,默认值是32。resize_height
:图像调整大小后的高度,默认值是32像素。resize_width
:图像调整大小后的宽度,默认值是32像素。num_paraller_workers
:多线程并行数,默认值是1。create_mnist_dataset
函数对MNIST训练数据集进行数据处理pipeline操作。data_path = './datasets/MNIST_Data/train'
batch_size = 4
mnist_ds = create_mnist_dataset(data_path=data_path, batch_size=batch_size)
取出一批batch数据,查看其数据张量及labe。
data = next(mnist_ds.create_dict_iterator(output_numpy=True))
images = data["image"]
labels = data["label"]
print('Tensor of image:', images.shape)
print('Labels:', labels)
结果:
Tensor of image: (4, 1, 32, 32)
labels: [8 8 7 0]
可视化处理后的数据。
import matplotlib.pyplot as plt
count = 1
for i in images:
plt.subplot(1, 4, count)
plt.imshow(np.squeeze(i))
plt.title('num:%s'%labels[count-1])
plt.xticks([])
count += 1
plt.axis("off")
plt.show()
结果:
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。