图像分类的数据集

article/2025/11/7 14:33:54

图像分类的数据集

  • 1. MNIST
  • 2. Fashion-MNIST
  • 3.CIFAR-10和CIFAR-100
  • 4. Caltech 101
  • 5. ImageNet
    • 5.1 ImageNet是什么?
    • 5.2 ILSVRC
  • 6. 各个数据集上的最新进展
  • 其他参考资料

1. MNIST

MNIST数据集的一个样例

MNIST数据集的一个样例

一般机器学习框架都使用MNIST作为入门,就像"Hello World"对于任何一门编程语言一样。
MNIST的全称是Modified National Institute of Standard and Technology.
参考文献:
[LeCun et al., 1998a]
Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner. “Gradient-based learning applied to document recognition.” Proceedings of the IEEE, 86(11):2278-2324, November 1998. [on-line version]

Yann LeCun 是纽约大学教授、Facebook 副总裁和首席 AI 科学家,2018年图灵奖得主。
Yann LeCun在1998年提出卷积神经网络,并将MNIST的错误率下降到0.7%。
MNIST官网有各种不同方法在这个数据集上的性能。
目前MNIST官网上列出的最优算法是Ciresan et al. CVPR 2012,错误率为0.23%。下表是这篇论文的试验结果。
在这里插入图片描述

2. Fashion-MNIST

Fashion-MNIST 是一个替代 MNIST 手写数字集 的图像数据集。 它是由 Zalando(一家德国的时尚科技公司)旗下的研究部门提供。其涵盖了来自 10 种类别的共 7 万个不同商品的正面图片。

Fashion-MNIST 的大小、格式和训练集/测试集划分与原始的 MNIST 完全一致,甚至文件名都完全一致。你可以直接用它替代原始的MNIST,且不需要改动任何的代码。

Why we made Fashion-MNIST?
In fact, MNIST is often the first dataset researchers try.
“If it doesn’t work on MNIST, it won’t work at all”, they said.
“Well, if it does work on MNIST, it may still fail on others.”

在这里插入图片描述

Fashion-MNIST数据集的一个样例

Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms. Han Xiao, Kashif Rasul, Roland Vollgraf. [arXiv:1708.07747]
[github下载地址],github上有各种算法在Fashion-MNIST数据集上的性能测评。
[Fashion-MNIST: Year In Review] 数据集作者回顾了数据集发布一年来对业界的贡献。

3.CIFAR-10和CIFAR-100

CIFAR-10和CIFAR-100都出自于规模更大的一个数据集80 million tiny images dataset。这个是一个大项目,你可以点击那个big map提交自己的标签,可以帮助他们训练让计算机识别物体的模型)。在Kaggle上有关CIFAR-10的介绍。

Please cite this technical report if you use this dataset: Learning Multiple Layers of Features from Tiny Images, Alex Krizhevsky, 2009.

就像MNIST,CIFAR-10是在计算机视觉和机器学习文献中的另一个标准的基准数据集。
CIFAR-10数据集分为5个batch的训练集和1个batch的测试集,每个batch包含10,000张图片。每张图像尺寸为32*32的RGB图像,且包含有标签。一共有10个标签:airplane、automobile、bird、cat、deer、dog、frog、horse、ship、truck十个类别。

在这里插入图片描述

CIFAR-10数据集的一个样例

CIFAR-100这个数据集和cifar10类似,它有100个类,每个类包含600个图像,600个图像中有500个训练图像和100个测试图像。100类实际是由20个类(每个类又包含5个子类)构成(5*20=100)。

类型如下:
在这里插入图片描述

4. Caltech 101

2004年,李飞飞介绍了CALTECH 101数据集(加利福尼亚理工学院101类图像数据集)。该数据集作为目标检测的流行的基准数据集。通常用于目标检测(如预测图像中特定对象的包围框的(x,y)坐标),有标注目标框坐标(Outlines of the objects in the pictures)。我们也可以用CALTECH-101来研究深度学习。CALTECH-101具有极大的类别失衡,使得它可以用于类别失衡算法方面的研究。

之前的图像分类方法在CALTECH-101上的精确度在35%-65%之间。目前可以利用深度学习用于图像分类来达到99%的分类正确率。下面表格中是各种算法在这个数据集上的性能。
Table of results for Caltech 101 dataset

在这里插入图片描述

5. ImageNet

5.1 ImageNet是什么?

ImageNet是李飞飞教授的一个项目,旨在根据一组定义的单词和短语,将图像标记并分类到将近2.2万个类别中。
超过1400万的图像URL被ImageNet手动注释,以指示图片中的对象;在至少一百万个图像中,还提供了边界框。ImageNet包含2万多个类别。
为了管理如此多的数据,采用WordNet层次管理,在WordNet中的每个有意义的单词或短语称为同义词集(synet)。在InageNet中,图像依据这些synet组织,目标是每个synet包含1000+的图像。
相关博客:

华人包揽CVPR 2019最佳论文,李飞飞ImageNet成就经典

李飞飞总结 8 年 ImageNet 历史,宣布挑战赛最终归于 Kaggle

斯坦福大学李飞飞最新演讲:ImageNet后,我专注于这五件事

5.2 ILSVRC

在计算机视觉和深度学习背景下,当人们谈论ImageNet时,很可能他们谈到的是ImageNet Large Scale Visual Recognition Challenge或者简写的ILSVRC。

在这个挑战中图像分类的目标是训练一个模型,使用大概120万张图像用于训练,50000张用于验证,100000张用于测试,能够将图像分类到1000个不同的类别中。这1000个类别代表了我们日常生活中遇到的目标类别,如不同种类的狗、猫,不同的车辆等等。

自2010年以来,ImageNet项目每年举办一次软件比赛,即ImageNet大规模视觉识别挑战赛(ILSVRC),软件程序竞相正确分类检测物体和场景。 ImageNet挑战使用了一个“修剪”的1000个非重叠类的列表。2012年在解决ImageNet挑战方面取得了巨大的突破,被广泛认为是深度学习革命的开始。自2012年以来,这项挑战的排行榜一直被CNNs和深度学习技术占据。从下图中可以看到,深度学习技术采用的神经网络层数越来越多,性能越来越好。2016年ILSVRC冠军的错误率是2.991%,低于人类的平均错误率5.1%。

在这里插入图片描述

6. 各个数据集上的最新进展

Classification datasets results:[What is the class of this image ?]

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

其他参考资料

更多图像分类的数据集
上面这个博客中不是简单罗列所有的数据集,而是详细讲解了每个数据集的特点,应用场景,发展历史。


http://chatgpt.dhexx.cn/article/BkKBs0Fi.shtml

相关文章

机器学习——图像分类

1 图像分类的概念 1.1 什么是图像分类? 图像分类,根据图像信息中所反映出来的不同特征,把不同类别的目标区分开来的图像处理方法 1.2 图像分类的难度 ●任何拍摄情 况的改变都将提升分类的难度 1.3 CNN如何进行图像分类 ●数据驱动型方法通…

图像分类算法

图像分类 参考链接1.前言2.K近邻与KMeans算法比较KNN原理和实现过程(1) 计算已知类别数据集中的点与当前点之间的距离:(2) 按照距离递增次序排序(3) 选取与当前点距离最小的k个点(4) 确定前k个点所在类别的出现频率(5) 返回前k个点出现频率最高的类别作为当前点的预…

图像分类方法总结

1. 图像分类问题描述 图像分类问题是计算机视觉领域的基础问题,它的目的是根据图像的语义信息将不同类别图像区分开来,实现最小的分类误差。具体任务要求是从给定的分类集合中给图像分配一个标签的任务。总体来说,对于单标签的图像分类问题&…

9.图片分类数据集

1. 图像分类数据集 MNIST数据集 [LeCun et al., 1998] 是图像分类中广泛使用的数据集之一,但作为基准数据集过于简单。 我们将使用类似但更复杂的Fashion-MNIST数据集。 %matplotlib inline import torch import torchvision from torch.utils import data from t…

CNN实现花卉图片分类识别

CNN实现花卉图片分 前言 本文为一个利用卷积神经网络实现花卉分类的项目,因此不会过多介绍卷积神经网络的基本知识。此项目建立在了解卷积神经网络进行图像分类的原理上进行的。 项目简介 本项目为一个图像识别项目,基于tensorflow,利用C…

常用图像分类网络

想对图像分类网络写个简要的概括,如有介绍不当之处,还望指出。 一、VGG网络 更新于2018年10月20日 参考博客:深度学习经典卷积神经网络之VGGNet 论文地址:VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITIO…

干货——图像分类(上)

这是译自斯坦福CS231n课程笔记image classification notes,由课程教师Andrej Karpathy授权进行翻译。本篇教程由杜客翻译完成。非常感谢那些无偿奉献的大师,在此代表所有爱好学习者向您们致敬,谢谢! 这是斯坦福大学的课程&#xf…

图像分类

图像物体分类与检测算法综述 转自《计算机学报》 目录 图像物体分类与检测算法综述 目录图像物体分类与检测概述物体分类与检测的难点与挑战物体分类与检测数据库物体分类与检测发展历程 图像物体分类与检测是计算机视觉研究中的两个重要的基本问题,也是图像分割、…

【图像分类数据集】非常全面实用的垃圾分类图片数据集共享

【图像分类数据集】非常全面实用的垃圾分类图片数据集共享 数据集介绍: 训练集 文件夹结构如下(部分: 第0类文件夹下数据展示如下(部分: 测试集 大致如下: 数据集获取方式: 总结&#xf…

python学习(18)--图片分类

图片分类 学习动机. 在这一节中我们会引入图片分类为题。这也是从一个合适的集合中分配给图片一个标记的任务。这是计算机视觉的核心问题之一。鉴于它的简单性,有一大批实用应用。更多的是,我们可以在以后的章节中看到,一些看似分离的计算机…

【OpenMMLab】图片分类发展简史

一、发展简述 图片分类是CV领域的基础任务,也是检测、分割、追踪等任务的基石。简而言之,图片分类就是给定一张图片,判断其类别,一般而言所有的候选类别是预设的。 从数学上描述,图片分类就是寻找一个函数&#xff0…

深度学习(1) ——图像分类

图像分类概述 图像分类实质上就是从给定的类别集合中为图像分配对应标签的任务,当我们输入一张图片,返回一个该图像类别的标签。限制条件:只能输入单目标图像。常用数据集:mnist、CIFAR-10、CIFAR-100、ImageNet 图像分类算法 …

CNN图片分类(Pytorch)

这篇文章主要讲述用 pytorch 完成简单 CNN 图片分类任务,如果想对 CNN 的理论知识进行了解,可以看我的这篇文章,深度学习(一)——CNN卷积神经网络。 图片分类 我们以美食图片分类为例,有testing、training、validation文件夹。下…

JavaWeb学习思维导图

这是我最近总结的JavaWeb学习思维导图,希望可以帮到大家:

javaweb学习总结

重定向 请求转发 区别:重定向后浏览器地址值会发生改变。 重定向request域对象不能共享数据,因为request域的范围是一次请求一次响应。而转发能够共享数据 请求转发的路径写法,只是需要写url-pattern的地址即可,不用带项目名&am…

JavaWeb学习心得总结

JavaWeb(JSPServlet)新手学习心得总结 说明: 由于篇幅的原因,本文只是对于JavaWeb项目的大致数据流程做一个介绍,同时引出一些JavaWeb开发中很基础的知识点,且不会精确到具体代码实现。 所以本文的适合读…

JavaWeb学习笔记总结(一)

前言:因为我是大三,这学期开课是JavaWeb,前端三剑客htmlcssjs,还有一个springboot框架的课,大二下学期才学的java跟sql,所以跨度直接到springboot有点大吧,ssm框架都没学,但是b站上有挺多教程的&#xff0c…

一.JavaWeb学习路线

Java系统学习路线: 第一阶段 第一阶段: Java 基础,包括 Java 语法,面向对象特征,常见API,集合框架。(基础) 第二阶段:Java API:输入输出,多线程,网络编程,反…

java web学习_JavaWeb学习路线

Java web,是用Java技术来解决相关web互联网领域的技术综合。Web包括:web服务器和web客户端。Java在客户端的应用有Java applet,不过使用很少。Java在服务器端的应用非常的丰富,比如Servlet,JSP和第三方框架等等。java技…

JavaWeb学习笔记

JavaWeb 1.ASP、PHP、JSP ASP: 微软&#xff1a;最早流行的就行ASP 在HTML嵌入VB的脚本 在ASP中&#xff0c;基本一个界面就有几千行代码&#xff0c;页面极其混乱&#xff0c;维护成本高 c#编程语言 IIS服务器 <h1> <% system.out.println("hello") …