ICDAR 2019比赛及数据集下载-任务-任务-ICDAR 2019扫描收据OCR和信息提取的稳健阅读挑战

article/2025/5/15 10:09:04

ICDAR 2019比赛及数据集下载-任务-

https://rrc.cvc.uab.es/?ch=13&com=tasks

任务-ICDAR 2019扫描收据OCR和信息提取的稳健阅读挑战

数据集和注释

数据集将具有1000个完整的扫描收据图像。每个收据图像包含大约四个关键文本字段,例如商品名称,单价和总成本等。在数据集中标注的文本主要由数字和英文字符组成。扫描收据示例如下所示:

 

 

数据集分为训练/验证集(“ trainval”)和测试集(“ test”)。“训练”集包括600张收据图像,这些图像将与参与者的注释一起提供给参与者。“测试”集包含400张图像,这些图像将在提交截止日期前几周提供。

对于接收OCR任务,数据集中的每个图像都用文本边界框(bbox)和每个文本bbox的脚本进行注释。位置标注为具有四个顶点的矩形,这些顶点从顶部开始按顺时针顺序排列。图像的注释存储在具有相同文件名的文本文件中。注释格式类似于ICDAR2015数据集的格式,如下所示:

x1_1,y1_1,x2_1,y2_1,x3_1,y3_1,x4_1,y4_1,成绩单_1

x1_2,y1_2,x2_2,y2_2,x3_2,y3_2,x4_2,y4_2,成绩单_2

x1_3,y1_3,x2_3,y2_3,x3_3,y3_3,x4_3,y4_3,transcript_3

对于信息提取任务,数据集中的每个图像都用一个文本文件注释,其格式如下所示:

{“公司”:“ STARBUCKS STORE#10208”,

“ date”:“ 14/03/2015”,

“ address”:“ 11302 EUCLID AVENUE,CLEVELAND,OH(216)229-0749”,

“ total”:“ 4.95”,
}

 

任务1-扫描的收据文本本地化

任务描述

本地化和识别文本是许多以前的比赛中出现的常规任务,例如ICDAR健壮阅读比赛(RRC)2013,ICDAR RRC 2015和ICDAR RRC 2017 [1] [2]。此任务的目的是精确定位具有4个顶点的文本。文本本地化基础事实将至少在单词级别。要求参与者提交一个zip文件,其中包含所有测试图像的结果。

评估协议

由于参与团队可能会应用本地化算法在不同级别(例如,文本行)定位文本,因此在此任务中,为了评估文本的本地化,将实施基于DetVal的方法。该方法部分地解决了所检测文本的一对多和多对一对应的问题。在我们的评估协议中,将基于F1得分进行计算并用于排名[3],从而计算平均平均准确度(mAP)和平均召回率。

 

任务2-扫描的收据OCR

任务描述

此任务的目的是准确识别收据图像中的文本。没有提供或不需要本地化信息。相反,要求参与者提供图像中识别的单词列表。该任务将仅限于包含拉丁字符和数字的单词。

训练此任务所需的基本事实是抄录中出现的单词列表。 为了获得 此任务的基本信息,应标记化在空间上拆分的所有字符串。例如,字符串“ Date:12/3/56”应标记为“ Date:”,“ 12/3/56”。字符串“ Date:12/3/56”应标记为“ Date:”“ 12”,“ /”,“ 3”,“ /”,“ 56”。

评估协议

对于“识别”排名,我们将参与者提供的所有单词与基本事实中的单词匹配。如果某些单词在图像中重复,则预期它们也会在提交结果中重复。我们将计算“精度”(在检测到的单词数范围内的正确匹配数)或“召回”(在“事实真词”数量范围内的正确匹配数)度量,并将F1分数用作最终排名度量。

 

任务3-从扫描的收据中提取关键信息

任务描述

此任务的目的是从给定的收据中提取多个关键字段的文本,并将每个收据图像的文本保存在json文件中,格式如图3所示。参与者将被要求提交一个包含以下内容的zip文件:所有测试发票图像。

评估协议

对于每个测试收据图像,将提取的文本与基本事实进行比较。如果提交的内容和提取的文本的类别均与基本内容匹配,则提取的文本被标记为正确;否则,标记为不正确。在所有测试收据图像的所有提取文本上计算精度。F1分数是根据精度和召回率计算的。F1分数将用于排名。

 

 

下载-ICDAR 2019扫描收据OCR和信息提取的强大阅读挑战

 

==================================================

 

对于SROIE竞赛,我们总共创建了1000张带注释的图像用于培训和测试。

SROIE竞赛任务的培训和验证数据集包含600张带批注的图像,现在可以从以下Google Drive和Baidu Pan链接下载这些图像:

  • https://drive.google.com/open?id=1ShItNWXyiY1tFDM5W02bceHuJjyeeJl2
  • https://pan.baidu.com/s/1a57eKCSq8SV8Njz8-jO4Ww#list/path=%2FSROIE2019&parentPath=%2F

任务1和任务2的测试数据集现已打开,现在可以从上面的Google云端硬盘和百度Pan链接下载该数据集。

 

任务3的测试数据集现已打开,可从上述链接下载。请注意,任务3测试数据集是任务1和2的测试数据集的子集(347张图像)(总共361张图像)。


http://chatgpt.dhexx.cn/article/eZqDCKbt.shtml

相关文章

【OCR】EAST算法数据处理——ICDAR_2015数据集

背景 下载地址:https://rrc.cvc.uab.es/?ch4&comdownloads 注意:该数据为开源数据,但需要注册一个账号,简单注册下即可下载; 介绍:用于文本检测任务,数据包含1000张训练样本以及500张测…

ICDAR 2019表格识别论文与竞赛综述(上)

ICDAR 2019表格识别论文与竞赛综述(上) 表格作为一种有效的数据组织与展现方法被广泛应用,也成为各类文档中常见的页面对象。随着文档数目的爆炸性增长,如何高效地从文档中找到表格并获取内容与结构信息即表格识别,成为…

ICDAR文本检测的评价方法

目录 简要介绍 文件准备 代码注释 简要介绍 具体的介绍可以看这几篇文章,讲解的很详细了,本文主要参考这三篇文章并对官方给的代码做一些解释 ICDAR2013文本检测算法的衡量方法(一)Evaluation Levels ICDAR2013文本检测算法…

技术探秘: 360数科夺得ICDAR OCR竞赛世界第一

ICDAR(国际文档分析与识别会议)是OCR识别领域最权威的会议之一。近期,360数科在ICDAR2019-SROIE(Results - ICDAR 2019 Robust Reading Challenge on Scanned Receipts OCR and Information Extraction - Robust Reading Competition) 榜单上…

TencentOCR 斩获 ICDAR 2021 三项冠军

作者:TencentOCR团队 全球 OCR 最顶级赛事,TencentOCR 以绝对领先优势斩获三冠,腾讯技术再扬威名! 一、竞赛背景 2021 年 9 月,两年一届的 ICDAR 竞赛落下帷幕,这是文字识别(OCR)领域…

ICDAR 2021竞赛 科学文献分析——表格识别综述部分(剩余部分是文档布局分析)

任务B为表格识别部分,本文暂只看表格识别摘要(不重要,想直接看表格识别部分可以跳过). 科学文献包含与不同领域的前沿创新有关的重要信息。自然语言处理的进步推动了科学文献信息自动提取的快速发展。然而,科学文献通…

ICDAR 2017 RCTW 中文场景文本检测和识别数据集

简介 ICDAR是进行场景文本检测和识别(Scene Text Detection and Recognition)任务最知名和常用的数据集。ICDAR 2017 RCTW[1](Reading Chinest Text in the Wild),由Baoguang Shi等学者提出。RCTW主要是中文,共12263张图像,其中8034作为训练…

ABCNet数据集转化(ICDAR 2015)及训练

ABCNet数据集转化(ICDAR 2015)及训练 目录 ABCNet数据集转化(ICDAR 2015)及训练一、环境配置1. detectron2 安装2. AdelaiDet 安装 二、ICDAR 2015 转化为Bezier pts格式三、网络训练1、文件目录2、训练3、训练过程中遇到的问题 一…

ICDAR 比赛技术分享

一 背景 ICDAR 2021(International Conference on Document Analysis and Recognition)于2021年9月5-10日在瑞士召开。ICDAR会议是文档分析与识别领域国际顶级会议,每两年举办一次,涵盖了文档分析与识别领域的最新学术成果和前沿…

世界人工智能大会与ICDAR有何不同?

从事人工智能领域的小伙伴对世界人工智能大会和ICDAR应该都不会陌生,它们似乎都是属于研究、讨论人工智能的一种会议,但其实它们的区别还是挺大的,具体来说,它们主要有以下的区别: 一、组织性质不同 ICDAR是Internati…

【赛事推荐】ICDAR2023国际学术竞赛,六大OCR未解难题等你来挑战!

关注公众号,发现CV技术之美 ICDAR(International Conference on Document Analysis and Recognition)是全球文档图像分析识别领域公认的权威学术会议,从1991年起每两年召开一次,今年是第17届,将于2023年9月…

AI领域著名的ICDAR是何物?有何作用?

来百度APP畅享高清图片 一、ICDAR是什么? ICDAR是International Conference on Document Analysis and Recognition(国际文档分析与识别会议)的缩写。它每两年举办一次,由国际文献识别与文本处理委员会(International…

富芮坤fr8008gp代码:堆栈设置;lv_timer_handler定时器研究和优化;广播数据中不用定义GAP_ADTVYPE_FLAGS;广播使用设备唯一地址

堆栈设置 fr8008gp使用自定义的linker脚本: ;256k bytes, which is 2M ROM ;ROM 0x00000000 0x40000 0x30000 ROM 0x10000000 0x800000 {ER_TABLE 0{*(jump_table_0)*(jump_table_1)*(jump_table_2)*(jump_table_3)*(jump_table_4)}ER_RO 0x10002000 FIXED{*(RO)}ER_BOOT …

数坤科技上市遇阻?申请材料失效,融资“数据打架”,存数亿缺口

2022年3月21日,贝多财经了解到,数坤(北京)网络科技股份有限公司- B(下称“数坤科技”)在港交所的上市申请材料已“失效”,目前已经无法正常查看或下载。这代表着,数坤科技首次冲刺上…

《数据》杂志刊登坤前署名文章:金融信创构筑产业数字化转型之路

《数据》--《产业转型研究》专刊 《数据》杂志是由北京市统计局和北京日报报业集团战略合作,专注于数据领域报道,并在全国发行的经济资讯类新闻期刊。此次清华大学互联网产业研究院产业转型顾问委员会专刊,聚焦产业转型研究,理论和…

“聚力远谋,创赢未来”坤前全国巡展广州站圆满落幕

9月28日,“聚力远谋,创赢未来”2021坤前生态合作伙伴交流全国巡展首站在广州正式启幕,来自各行各业的核心客户及坤前生态合作伙伴齐聚一堂,共话信创产业发展。 飞腾信息技术有限公司华南区域总监李荣恩先生对会议主办方坤前表达了…

易经读书笔记02坤为地

地道柔刚 象曰 地势坤,君子以厚德载物。 坤:元,亨,利牝马之贞。 君子有攸往,先迷后得主,利;西南得朋,东北丧朋。 安贞,吉。 牝马指母马。为什么不用母牛?因为…

坤卦

坤卦 坤卦三偶六断,纯阴虚阙之象。“坤”字古文作“巛”,“顺”字偏旁及“川”字,亦“巛”之象形也,故《象传》曰“乃顺承天”,又曰“柔顺利贞”。《文言传》曰:“坤道其顺乎?”《系辞传》曰&am…

数坤科技:AI在医疗影像的应用和探索

机器之心编辑部 3 月 23 日,在机器之心 AI 科技年会上,数坤科技研发副总裁危夷晨发表了主题演讲《AI 在医疗影像的应用和探索》,对 AI 医疗影像行业进行了全面的介绍。 以下为危夷晨在机器之心 AI 科技年会上的演讲内容,机器之心…

周易卦爻解读笔记——大壮

第三十四卦大壮 雷天大壮 震上乾下 大壮卦为消息卦,象征阳盛阴衰。 大壮卦是遁卦的覆卦,序卦传【物不可以终遁,故受之以大壮】 首先说明壮这个字: 武士操戈而立,可以理解为强壮,更多的是要理解为打击&…