深度学习常用数据集的分类解析
本文主要探讨深度学习常用数据集,涵盖图像、文本、语音、推荐等多个领域的关键数据集:
一、计算机视觉数据集
1.经典图像分类
MNIST
手写数字(0-9),6万训练+1万测试
入门基准,常用于算法验证
CIFAR-10/100
10类(CIFAR-10)或100类(CIFAR-100)物体图片
32x32小尺寸,适合轻量模型测试
ImageNet
1400万图片,2万类别(常用子集:ILSVRC 2012,1000类)
深度学习发展里程碑,预训练模型基准
2.目标检测与分割
PASCAL VOC
20个常见物体类别,含目标检测/分割/动作识别标注
经典中型数据集
COCO
