论文阅读:Segmentation-Based Deep-Learning Approach for Surface-Defect Detection

article/2025/9/21 15:27:33

PDF\CODE

基于深度学习分割的表面缺陷检测

Domen Tabernik(domen.tabernik@fri.uni-lj.si);

Samo Šela;

Jure Skvar\breve{c}

Danijel Sko\breve{c}aj(danijel.skocaj@fri.uni-lj.si)

part of Springer Nature 2019

摘要:基于机器学习的表面缺陷自动检测已经成为一个有趣且有发展前景的研究领域,对视觉检测的应用领域产生了非常高且直接的影响。深度学习方法已成为最适合这项任务的方法。它们允许缺陷检测系统通过学习仅仅向它显示一些范例图像来检测表面缺陷。本文提出了一种用于表面缺陷检测和分割的基于分割的深度学习体系结构,并在特定的表面裂纹检测领域进行了演示。该体系结构的设计使模型能够使用少量样本进行训练,这是实际应用的一个重要要求。该模型与相关的深度学习方法(包括最先进的商业软件)进行了比较,结果表明该方法在表面裂纹检测的特定领域优于相关的方法。大量的实验也清楚地展示出所需的标注精度、所需的训练样本数量和所需的计算成本。实验是在一个新创建的基于真实质量控制案例的数据集上进行的,实验结果表明了所提出的方法能够在少量缺陷表面上进行学习,仅使用大约25 - 30个缺陷训练样本,而不是在深度学习应用案例中通常需要的成百上千个训练样本。这使得深度学习方法能够在缺陷样本数量有限的工业上得到实际应用。本文的数据集也公开提供,以鼓励开发和评估用于表面缺陷检测的新方法。

关键字:表面缺陷检测;外观检测;质量控制;深度学习;计算机视觉;分割网络;工业4.0

引言

在工业生产过程中,确保成品质量的最重要的任务之一是检查产品的表面。通常,表面质量控制是手工进行的,工人们经过培训来识别复杂的表面缺陷。然而,这种控制非常耗时,效率低下,并可能严重限制生产能力。在过去,经典的机器视觉方法足以解决这些问题((Paniagua et al. 2010; Bulnes et al. 2016);然而,随着工业4.0范式的发展,趋势正朝着生产线的普遍化方向发展,需要对新产品的快速适应能力((Oztemel and Gursev 2018)。传统的机器视觉方法无法保证这样的灵活性。通常,在经典的机器视觉方法中,特征必须是手工制作的,以适应特定的领域。然后使用人为设定的基于规则的方法或使用基于学习的分类器(如SVM、决策树或KNN)做出决策。由于手工制作的特征扮演了十分重要的角色,因此这种分类器不如深度学习方法强大。各种滤波器组、直方图、小波变换、形态学操作和其他技术被用来手工制作适当的特征。手工设计特征在经典方法中占有重要的地位,但是这些特征并不适合所有的任务,并且在机器视觉方法必须手工适应不同产品的情况下,导致开发周期长。可以在数据驱动、机器学习方法中找到一种提高灵活性的解决方案,其中开发的方法可以快速适应新类型的产品和表面缺陷,使用适当数量的训练图像。

本文着重于使用最先进的机器学习方法来解决视觉表面缺陷的检测问题。近年来,深度学习方法已经成为计算机视觉领域最常见的方法。应用于表面质量控制问题(Chen and Ho 2016;Faghih-Roohi et al. 2016;Weimer et al. 2013;Kuo et al. 2014),深度学习方法可以取得优异的效果,并且可以适用于不同的产品。与经典的机器视觉方法相比,深度学习可以直接从底层数据中学习特征,对复杂结构的表征能力更强,从而用自动学习过程完全取代手工制作特征。由于对新产品的快速适应,这种方法非常适合工业4.0所要求的柔性生产线。然而,悬而未决的问题仍然存在:需要多少标签数据,以及标签需要多精确,程序的性能才能适合实际应用?在处理深度学习方法时,这是一个特别重要的问题,因为具有数百万个可学习参数的深度模型通常需要数千张图像,而在实践中往往很难获得这些图像。

本文探索了适合于表面质量控制的深度学习方法。特别是,本文研究了深度学习方法应用于工业品表面裂纹检测(见图1)。我们不仅从总体分类性能出发,还从工业4.0特别重要的三个特征:(a)标签需求、(b)所需训练样本的数量和(c)计算需求的角度出发,探索了合适的网络架构。数据需求是通过利用一个基于两阶段架构的深度卷积网络的有效方法来解决的。提出了一种新的分割和决策网络,该网络适合从少量的缺陷样本中学习,但仍能获得最先进的结果。对所提出的方法的一个广泛的评估是在一个新的、真实的被称为KolektorSDD的表面缺陷数据集进行的。该数据集代表了一个工业半成品表面缺陷检测的现实问题,在这里,可用于训练的缺陷图像的数量是有限的。通过强调三个重要的方面,证明所提出的方法已经适合研究的应用程序:(a)为达到100%的检出率所需的人工检查(通过额外的人工检测验证),(b)所需的标注细节和导致所需的人工人工成本的训练样本数量,以及(c)所需的计算成本。在研究领域,所设计的网络性能优于相关的最新商业产品和两种标准分割网络。

本文的文章结构安排如下:在相关工作部分给出了相关工作,在所提出的方法部分详细介绍了分割和决策网络。在分割和决策网络评价部分详细介绍了对所提议网络的广泛评价,并在“与最先进的部分的比较”部分与最先进的商业解决方案进行了比较。论文最后在讨论和结论部分进行了讨论。

 

相关工作

在引入AlexNet后不久,深度学习方法开始被更多地应用于表面缺陷分类问题((Krizhevsky et al. 2012)。Masci等人(2012)的工作表明,对于表面缺陷分类而言,深度学习方法优于传统的将手工设计的特征与支持向量机相结合的机器视觉方法。他们通过使用具有五层的卷积神经网络对几种钢铁缺陷类型进行图像分类这一实验证明了这一点,并取得了优异的成绩。但是由于没有使用ReLU和batch标准化处理,他们的工作仅限于浅层网络。FaghihRoohi等人(2016)使用了类似的架构来检测铁路表面缺陷。他们使用ReLU作为激活函数,并针对钢轨缺陷分类的具体问题对几种网络规模进行了评估。

在卷积网络的现代实现中,Chen和Ho(2016)应用了OverFeat (Sermanet和Eigen 2014)网络来检测五种不同类型的表面误差。他们识别了大量标记数据,这是深度网络的一个重要问题,并提出使用一个已有的预训练网络来缓解这一问题。他们利用在ILSVRC2013数据集中的120万幅普通视觉对象图像上训练OverFeat网络,然后使用该网络对有表面缺陷的图像进行特征提取。他们利用支持向量机在深度特征的基础上学习分类器,证明了预训练的特征优于LBP特征。利用所提出的近似表面粗糙度启发式算法,他们可以进一步改进该结果;然而,他们的方法并没有在目标域中学习网络,因此没有充分利用深度学习的潜力。

Weimer等人(2016)评估了用于表面检测的几种不同深度的深度学习体系结构。他们应用的网络从只有5层到11层不等。他们的评估集中在6种不同类型的合成误差上,结果显示深度网络优于任何经典方法,对合成数据集的平均精度达到99.2%。他们的方法也能够将误差定位在几个像素的精确度之内;但是,他们的定位方法效率很低,从每幅图像中提取小的patch,然后对每个单独的图像patch进行分类。

Ra\check{c}ki等人(2018)提出了一种更有效的缺陷分割网络。他们实现了一个10层的全卷积网络,同时使用ReLU和batch归一化批处理对缺陷进行分割。此外,他们在分割网络的特征之上,提出了一个附加的决策网络针对缺陷是否存在对每幅图像进行了分类。这使得他们可以提高对合成表面缺陷数据集的分类精度。

最近,Lin等人(2018)提出了LEDNet架构,用于使用30000张低分辨率图像的数据集检测LED芯片图像缺陷。他们提出的网络遵循AlexNet架构,但是去掉了完全连接的层,取而代之的是加入了类激活映射(CAMs),类似于Zhou等人(2016)。这种设计允许他们学习只使用每幅图像标签和使用凸轮定位的缺陷。与传统方法相比,所提出的LEDNet在缺陷检测率上有显著提高。

与相关方法相比,本文提出的方法遵循分割网络和决策网络两阶段设计,类似于Ra\breve{c}ki等人(


http://chatgpt.dhexx.cn/article/XKrm3IMs.shtml

相关文章

Segmentation-based deep-learning approach for surface-defectdetection(基于分割的表面缺陷深度学习检测方法)

论文地址:https://arxiv.org/abs/1903.08536v3 摘要 基于机器学习的表面异常自动检测已经成为一个有趣且有前途的研究领域,对视觉检测的应用领域有着非常直接的影响。深度学习方法已经成为完成这项任务最合适的方法。它们允许检查系统学习通过简单地显示…

康耐视Designer,VisionPro和ViDi匹配版本兼容-关于外观缺陷检测中肯的建议与评价

海康visionmaster-颜色区分任意选 ​康耐视VisionPro传统检测对缺陷类检测很差,差到不能用。单靠康耐视VisionPro深度学习VIDI,据视觉人粉丝很多大厂反馈,现场项目落地的可能性降低不低于20%。 缺陷检测建议:多软件融合使用&#…

veni vidi vici密钥我的生日ACIGS解密_25人在同一天生日!男女比例又是多少?阳光新生大数据来了!...

2020年 阳光学院共迎来了3884名 活力四射、意气风发的 本科生小萌新 阳光招办带你 一起解密 新生大数据~ 准备好了吗? GO! 2020级普本新生2489人, 专升本新生1395人, 他们分别来自五湖四海,快来找找老乡吧~ 世界那么大,还是遇见你~ 相聚是一种妙不可言的缘分~ 2020级阳光…

vidi深度学习图像处理软件2.1

有需要这个软件的,请加我的QQ7299789 VIDI 提供了第一款基于工业图像分析的深度学习软件。VIDI Suite基于最先进的机器学习算法,是一款优化可靠的可现场测试的软件解决方案。它可以完成检测与分类的编程中不可能完成的挑战。这为不少具有挑…

Insight ViDi系列相机 FTP存图

一、测试说明 标题发现问题:使用In-Sight Vision Suite这个软件设置FTP存图,不能像In-Sight Explorer一样,设置各本地路径就可以直接存图。 相机软件:In-Sight Vision Suite(22.3.0) 电脑本地IP&#xff1…

康耐视深度学习ViDi界面介绍-选项菜单

海康机器视觉Visionmaster-距离与角度测量 选项菜单 Workspace ----------- 程序操作的菜单项 Tool ------------------- 工具操作的菜单项 Database ------------ 数据库操作的菜单项 View ------------------ 特征标注操作的菜单项 Plugins --------------- 插件信息显示菜单…

深度学习康耐视ViDi如何添加工具

在建立好一个Workspace后,会出现一个 图标 点击该图标的加号,即可显示可用的工具。 点击需要添加的工具,即可完成工具的添加

VIDI软件在粗糙金属表面缺陷检测中的应用

2017年1月12日在中国汽车协会举办的信息发布会上,中汽协秘书长助理代表协会对2017年中国汽车市场作出预测:“2017年我国的汽车产销量预计为2940万辆,增速预计保持在5%左右。”在当天发布的产销数据中,2016年汽车销量达2803万辆。 …

深度学习康耐视VIDI-蓝色定位工具1

机器视觉-康耐视visionpro-外观缺陷检测-缺失不少哈 每一个学员都会经历失败,专业于机器视觉visionman团队切中要害,尽快解决学员这些问题。 -专业于机器视觉visionman团队教学宣言 蓝色定位工具用于识别和定位图像中的特定特征或特征组。该工具的输出可用于为其他ViDi 工具…

康耐视ViDi如何实现工具之间的关联

(Q有答疑)康耐视智能相机Insight-边缘检测 要创建一系列工具,请在添加工具后,按工具图标上的加号图标。这样,您即可创建一系列工具,而每个工具都通过有相应工具颜色的关联选项卡显示。您可以通过单击相应 的工具从一个工具关联到下…

深度学习康耐视ViDi 工具概述

(Q有答疑)康耐视智能相机Insight-CD光盘表面检测 Cognex ViDi 工具是一系列机器视觉工具,通过深度学习解 决各种难以解决的挑战。虽然这些工具共享一个引擎,但它们 在图像中寻找的内容不同。更具体地说,在分析单个点、单个 区域或完整图像时,每个工具都有不同的侧重点。 C…

词向量与语言模型

本篇博客是对于 https://www.cnblogs.com/nickchen121/p/15105048.html#%E7%AC%AC%E4%B8%80%E7%AF%87-transformergptbert%E9%A2%84%E8%AE%AD%E7%BB%83%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E7%9A%84%E5%89%8D%E4%B8%96%E4%BB%8A%E7%94%9F%E7%90%86%E8%AE%BA的归纳 先来了解一…

利用word2vec训练词向量

利用word2vec训练词向量 这里的代码是在pycharm上运行的,文件列表如下: 一、数据预处理 我选用的数据集是新闻数据集一共有五千条新闻数据,一共有四个维度 数据集:https://pan.baidu.com/s/1ewzlU_tBnuwZQxVOKO8ZiA 提取码: …

词向量(WordVector)

词向量(WordVector) 时间: 2015-06-12 22:01:12 阅读: 2120 评论: 0 收藏: 0 [点我收藏] 标签: Reference:http://licstar.net/archives/328 (比较综合的词向量研究现状分…

词向量表示方法及其语义相关性

关键字: 文档 句子 词语 单词 上下文单词 上下文窗口 向量 相似性 类比性 欧几距离 余弦距离 余弦相似度 相似度阀值 归于此类 创建新的类别 词向量 --- word2vec、glove 相似度 --- 欧几距离、余弦距离 聚类 --- kmeans 、词向量 是指将词转化成为稠密向量&…

词向量表示和句向量、文章向量计算方法

本文介绍一种计算句向量和文章向量的方法及参考代码,自然语言处理的第一步即是要进行文本的向量化,包括获得词向量,句向量或者文章向量,以便输入各种机器学习模型或者深度学习模型。 词向量 可以笼统的认为词向量是文本向量的基…

词袋模型和词向量模型

在自然语言处理和文本分析的问题中,词袋(Bag of Words, BOW)和词向量(Word Embedding)是两种最常用的模型。更准确地说,词向量只能表征单个词,如果要表示文本,需要做一些额外的处理。…

中文词向量的训练

最近在做毕设,需要对中文进行向量化表示,现有的最全中文词向量预训练向量有:最全中文词向量 part 1:以上链接中的词向量介绍: 格式 预先训练好的向量文件是文本格式。每行包含一个单词和它的向量。每个值由空格分隔。第一行记录…

如何训练一个词向量

现在在NLP领域,词向量是一切自然语言处理的基础,有了词向量我们就可以进行数据分析,文本聚类分类的一系列操作了。接下来我们就开始学习如何训练词向量,之前我们有介绍关于 word2vec 的博文 word2vec算法理解和数学推导&#xff0…

词向量训练

词向量训练 一、 实验目的 掌握课堂所讲词向量的基本概念和训练方法。加强对pytorch、tensorflow等深度学习框架的使用能力。 二、 实验要求 任选课上讲的一种词向量模型进行实现即可,如是其他模型则请写明模型结构,作业压缩文件中也提供给大家相关的…