COCO数据集简介

article/2025/9/9 21:24:29

简介

介绍一下目标检测领域另外一个比较有名的数据集 MS COCO (Microsoft COCO: Common Objects in Context) .

MSCOCO 数据集是微软构建的一个数据集,其包含 detection, segmentation, keypoints等任务。

MSCOCO主要是为了解决detecting non-iconic views of objects(对应常说的detection), contextual reasoning between objects and the precise 2D localization of objects(对应常说的分割问题) 这三种场景下的问题。

下面是iconic 图片和 non-iconic 图片之间的对比。

 

与PASCAL COCO数据集相比,COCO中的图片包含了自然图片以及生活中常见的目标图片,背景比较复杂,目标数量比较多,目标尺寸更小,因此COCO数据集上的任务更难,对于检测任务来说,现在衡量一个模型好坏的标准更加倾向于使用COCO数据集上的检测结果。

数据集的构建过程不说了。主要关注一下统计信息

1 统计信息

MSCOCO总共包含91个类别,每个类别的图片数量如下:

 

 

  • 图中也标出了PASCAL VOC的统计数据作为对比。

下图展示的是几个不同数据集的总类别数量,以及每个类别的总实例数量,一个实例就是图片上的一个目标,主要关注一下 PASCAL 和 ImageNet。

 

 

  • COCO数据集的类别总数虽然没有 ImageNet 中用于detection的类别总数多,但是每个类别的实例目标总数要比PASCAL和ImageNet都要多。

下图是每张图片上的类别数量或者实例数量的分布,括号中为平均值

 

 

  • PASCAL和ImageNet中,每张图片上的类别或者实例数量普遍都很少。
    以PASCAL为例:有多于70%的图片上都只有一个类别,而多于50%的图片上只有一个实例或者目标。PASCAL数据集平均每张图片包含1.4个类别和2.3个实例目标,ImageNet也仅有1.7和3.0个。
  • COCO数据集平均每张图片包含 3.5个类别和 7.7 个实例目标,仅有不到20%的图片只包含一个类别,仅有10%的图片包含一个实例目标。
  • COCO数据集不仅数据量大,种类和实例数量也多。从这角度来说 SUN 数据集这两个指标更高一点,但是这个数据集在目标检测里面并不常用。

实例目标的分布

 

 

  • COCO数据集中的小目标数量占比更多

关于数据集的划分,COCO的论文里是这么说的,

The 2014 release contains 82,783 training, 40,504 validation, and 40,775 testing images (approximately 1/2 train, 1/4 val, and /4 test). There are nearly 270k segmented people and a total of 886k segmented object instances in the 2014 train+val data alone. The cumulative 2015 release will contain a total of 165,482 train, 81,208 val, and 81,434 test images.

2014年的数据在官网是可以下载的,但是2015年只有test部分,train和val部分的数据没有。另外2017年的数据并没有什么新的图片,只是将数据重新划分,train的数据更多了,如下:

 

 

2 评估标准

COCO的测试标准比PASCAL VOC更严格:

 

 

  • PASCAL 中在测试mAP时,是在IOU=0.5时测的
  • COCO中的AP 是指在 10个IOU层面 以及 80个类别层面 的平均值
  • COCO的主要评价指标是AP,指 IOU从0.5到0.95 每变化 0.05 就测试一次 AP,然后求这10次测量结果的平均值作为最终的 AP
    AP@0.5 跟PASCAL VOC中的mAP是相同的含义
    AP@0.75 跟PASCAL VOC中的mAP也相同,只是IOU阈值提高到了0.75,显然这个层面更严格,精度也会更低
    IOU越高,AP就越低,所以最终的平均之后的AP要比 AP@0.5 小很多,这也就是为什么COCO的AP 超过 50%的只有寥寥几个而已,因为超过50%太难了。而且由于COCO数据集本身数据的复杂性,所以目前的 AP@0.5 最高也只有 73% 。
  • COCO数据集还针对 三种不同大小(small,medium,large) 的图片提出了测量标准,COCO中包含大约 41% 的小目标 (area<32×32area<32×32), 34% 的中等目标 (32×32<area<96×9632×32<area<96×96), 和 24% 的大目标 (area>96×96area>96×96). 小目标的AP是很难提升的。
  • 除了AP之外,还提出了 AR 的测量标准 跟AP是类似的。

COCO提供了一些代码,方便对数据集的使用和模型评估 :https://github.com/cocodataset/cocoapi


http://chatgpt.dhexx.cn/article/ZVovNgIv.shtml

相关文章

[ 数据集 ] COCO 数据集介绍

&#x1f935; Author &#xff1a;Horizon Max ✨ 编程技巧篇&#xff1a;各种操作小结 &#x1f387; 机器视觉篇&#xff1a;会变魔术 OpenCV &#x1f4a5; 深度学习篇&#xff1a;简单入门 PyTorch &#x1f3c6; 神经网络篇&#xff1a;经典网络模型 &#x1f4bb; …

MS COCO数据集

1. MS COCO数据集介绍 MS COCO的全称是Microsoft Common Objects in Context&#xff0c;起源于微软于2014年出资标注的Microsoft COCO数据集。 官网地址&#xff1a;http://cocodataset.org COCO是一个具有非常高的行业地位且规模非常庞大的数据集&#xff0c;用于目标检测…

COCO数据集格式解析

COCO数据集是我们经常使用的一个数据集&#xff0c;并且 COCO数据集格式也很受大家欢迎&#xff0c;但不同于 VOC数据格式&#xff0c;COCO是将所有的标注数据存放在一个json文件中&#xff0c;使得查看的时候云里雾里&#xff0c;最近也在用COCO数据集做实例分割&#xff0c;顺…

自定义coco数据集

1、环境 anaconda环境安装配置 2、工具 安装labelme工具 3、安装软件 3.1、打开anaconda控制台 3.2、创建虚拟环境 conda create -n labelme python3.73.3、激活环境 conda activate labelme3.4、下载labelme pip install labelme3.5、输入labelme打开软件 以后打开跳…

COCO数据集概述

COCO数据集概述 COCO的全称是Common Objects in Context&#xff0c;是微软团队提供的一个可以用来进行图像识别的数据集。MS COCO数据集中的图像分为训练、验证和测试集。其行业地位就不再多少了&#xff0c;本文主要梳理一下该数据集包含的内容。下图是官网给出的可下载的数…

CoCo数据集下载

文章目录 1.介绍2.下载2.1 官网2.2 百度网盘2.3 下载到linux服务器 1.介绍 MS COCO的全称是Microsoft Common Objects in Context&#xff0c;起源于微软2014年的Microsoft COCO数据集 COCO is a large-scale object detection, segmentation, and captioning dataset. COCO h…

COCO数据集梳理

COCO数据集简介 coco数据集下载需要翻墙 COCO - Common Objects in Context 关键索引 以instances_val2017.json为例&#xff0c;有的博客说还有一个关键索引type&#xff0c;但是我没找到 info/licenses 这俩货没啥可说的&#xff0c;数据信息和版权吧&#xff0c;个人用…

COCO 数据集

COCO简介&#xff1a; COCO数据集是微软团队获取的一个可以用来图像recognitionsegmentationcaptioning 数据集. 官方说明网址&#xff1a;http://mscoco.org/。 该数据集主要有的特点如下&#xff1a; &#xff08;1&#xff09;Object segmentation; &#xff08;2&#xff…

Pascal VOC 和 Microsoft COCO(MS COCO)(COCO2017COCO2014) 数据集

Pascal VOC&#xff08;Pascal Visual Object Classes&#xff09;数据集 VOC数据集是目标检测/分割经常用的一个数据集&#xff0c;从05年到12年都会举办比赛 VOC数据集的格式 用于分割 Paslcal VOC 2012 用于分隔的数据集是由20个类1个背景类 训练集1464张 val集 1449张 Micr…

COCO数据集解析

1 简介 官方网站&#xff1a;http://cocodataset.org/ 全称&#xff1a;Microsoft Common Objects in Context &#xff08;MS COCO&#xff09; 支持任务&#xff1a;Detection、Keypoints、Stuff、Panoptic、Captions 说明&#xff1a;COCO数据集目前有三个版本&#xff0c;…

COCO数据集介绍

COCO数据集详细介绍 前言一、什么是COCO数据集&#xff1f;COCO数据集可以应用到的Task&#xff1a;一个简单的数据集实例展示&#xff1a;附录80个类别 二、COCO数据集的格式介绍基础的数据格式介绍不同Task下的annotationObject Detection annotationother task&#xff1a; …

COCO数据集的介绍和使用

这篇文章是我研究生阶段入学期间学习所记&#xff0c;主要供自己使用&#xff0c;结合了论文原作和源码&#xff0c;中间借鉴的一些b站的视频以及他人博客的解释&#xff0c;会在文章末尾贴出链接。 目录 COCO数据集的介绍 COCO数据集标注格式 pycocotools的安装和coco api…

数据结构与算法之基础概述

目录 数据结构和算法的重要性数据结构概述逻辑结构存储结构 算法概述如何理解“大O记法”时间复杂度空间复杂度 数据结构和算法的重要性 算法是程序的灵魂&#xff0c;优秀的程序可以在海量数据计算时&#xff0c;依然保持高速计算 数据结构和算法的关系&#xff1a; 程序 数…

1.0 JAVA数据结构与算法

学习总结 利用计算机来解决显示世界中的各种实际问题时&#xff0c;首先要将实际问题中的操作对象抽象为能够用计算机表示的数据&#xff0c;为这些数据建立一个数学模型&#xff08;数据的逻辑结构&#xff09;&#xff0c;再面对数据以某种组织形式进行存储&#xff08;数据…

数据结构和算法的区别

1.数据结构 数据结构是相互之间存在一种或多种特定关系的数据元素的集合。 数据结构包括三方面的内容&#xff1a;逻辑结构、存储结构和数据的运算。 1.数据的逻辑结构 数据的逻辑结构分类图如下&#xff1a; 2.数据的存储结构 存储结构是指数据结构在计算机中的表示&#xf…

肝完了,一天掌握数据结构和算法面试题,吊打面试官,一起学习吧

最近有小伙伴面试&#xff0c;对数据结构和算法比较头疼&#xff0c;我整理了一波资料&#xff0c;帮助大家快速掌握数据结构和算法的面试&#xff0c;感觉有用的小伙伴&#xff0c;点赞支持哦&#xff01; 不叨叨&#xff0c;直接上干货。 目录 Q1&#xff1a;数据结构和算…

大一新生先学C语言编程还是先学C语言的数据结构和算法?

大家好&#xff0c;我是辣条。 这是一位粉丝朋友给我的私信&#xff0c;今天就他这个问题好好聊聊。 先学C语言在学数据结构和算法 先说答案建议先学C语言&#xff0c;掌握基本的语法基础后&#xff0c;再学数据结构与算法&#xff0c;C语言编程与数据结构和算法这两个完全是…

【数据结构和算法】如何学习数据结构与算法 ?过来人的建议(一)【方法篇】

&#x1f388; 作者&#xff1a;Linux猿 &#x1f388; 简介&#xff1a;CSDN博客专家&#x1f3c6;&#xff0c;华为云享专家&#x1f3c6;&#xff0c;Linux、C/C、云计算、物联网、面试、刷题、算法尽管咨询我&#xff0c;关注我&#xff0c;有问题私聊&#xff01; &…

数据结构与算法简介

0. 内容说明 最近在自己编写一些小的算法的时候&#xff0c;深感自己的算法过于臃肿。碰巧Datawhale在新的一期组队学习中组织了数据结构与算法的课程学习。于是就参加了&#xff0c;再次感谢Datawhale~~ 首先跟大家分享一下两个自己感觉比较好的学习资料&#xff0c;一个是 …

数据结构和算法知识点整理

Q1&#xff1a;数据结构和算法的知识点整理&#xff1a; 数据结构和算法的需要掌握的知识点&#xff0c;我的好朋友启舰整理的&#xff1a; Q2&#xff1a;链表&#xff0c;队列和栈的区别 链表是一种物理存储单元上非连续的一种数据结构&#xff0c;看名字我们就知道他是一种…