工业数据挖掘实例

article/2025/10/30 21:19:00

智能的基础是智能决策,所有的决策都来自于分析。所以简单说所有的智能都是做好两件事:收集数据,使用数据。数据挖掘技术根据业务数据不同有不同的应用场景。在我以往工作中主要在以下领域有应用尝试:

  • 市场营销:用数据挖掘进行消费者画像,定向进行产品推荐
  • 生产质量:根据质检状况,借用数据挖掘技术分析质量不合格的诱因并推荐优化方案,比如机器设备参数最佳取值。
  • 能源消耗:使用数据挖掘技术分析能源消耗的超标区间,非必要能源消耗区间并推荐优化方案。
  • 设备维护:通过监控设备运行的参数性能,结合设备故障原因分析参数和故障相关性,从而进行主动性维护,减少非计划停机。
  • 智能排产:完全的自动化排产还没有实现。但是现阶段的排产算法依然可以帮助计划员减少很多考虑时间,自动提供出一定排产方案
  • 物流: 根据各区域的订单量进行前置仓和配发站点的选址

需要指出的是,虽然目前有很多数据挖掘算法和案例,但是还是主要用于网络数据。这些算法在工业领域有明显的过拟合现象不能直接使用,需要作出一些优化调整。

下面我用一个实际工业数据挖掘的例子来展示数据挖掘在工业领域如何应用。
【背景介绍】这条生产线的大致工艺如下图所示:左边是生产线输入,右边是输出待检的成品,经过质检后产品又分为合格品和残次品。我们数据挖掘的目的是根据生产产品的实时质检数据动态调整机器参数以寻求产品质量的最优。
在这里插入图片描述

【数据采集】在这个案例中我收集三部分数据:

  1. 加工产品的基本信息,节拍时间,模具编号等信息,这些数据一般可以从MES系统中抓取。
  2. 质检机器的质检结果,包括图像和质检数据结果,以及质检部门给出的标准质检值和误差范围
  3. 对应加工时间内机器的各项参数。这些数据可以从PLC读取。PLC数据的读取可以借用OPC、物联网网关、工业数据采集卡或者外置传感器。
    【数据分析】
    在这里插入图片描述

简单的数据挖掘步骤包括数据收集,数据清洗,模型选取和训练,模型检验和实施预测。在工业数据领域,我们必须考虑到数据纬度太大。如果直接开始模型训练,必然出现过拟合现象。而且工业数据和互联网数据有个会很大的区别。比如电流,电压和功率本身就有物理相关性。并没有必要一起作为数据分析的特征。所以在模型训练之前,我们可以先做特征选取和特征增强,减少不必要的分析风险。
在这里插入图片描述

数据收集和清洗之后,我们先进行一轮数据基本展示:
在这里插入图片描述

横坐标是时间,纵坐标是模具编号。我们很容易的发现几个问题:
1. 质检不合格产品大多数发生在一段空档期后,也就是换模之后。这是工业界的常识,换模影响产品质量
2. 不同模具生产的产品合格率并不一样。说明产品性能受到模具本身误差的影响。由此我们已经可以标识出一部分不合格模具。
在这里插入图片描述

3. 所有的分析都是需要有参照的。在本案例中,我们选取了两个区间范围。这两个范围内质检合格率较高。通过对比CP和CPK参数,我们最终选定第二区间为参照区间

我们对机器主要参数性能也进行数据展示:
在这里插入图片描述

我们暂且不用计较两个参数的具体含义。但是从图上可以很容易看出来,两个参数的数据存在一些时间差。理论上各个参数应该在同一时间达到极值。虽然这样的推断并不严谨。但是我们有理由相信收集的不同机器的数据存在时间切片不对的问题。实际上,在工厂车间的很多机器都是不联网的,难免出现机器时间的不准确。
简单的根据极值,我们进行数据平移,然后得到时间极值相吻合的数据合集。
在这里插入图片描述

在得到合理且高质量的数据后,我们可以进行数据分析了。
首先,我们进行了降维操作。因为我们最终是要推荐每个机器参数的理想取值范围,所以有必要保留原始的数据维而不能使用PCA降维方法。好在我们的维度数目不算过于庞大。我么很容易用对比ROC的方式对每一个维度的影响进行了评估筛选。最终保留了以下维度。进而,我们用随机森林算法获得了每个维度的影响因子:
在这里插入图片描述

在此基础上,我们对质量缺陷的位置进行了汇总。
在这里插入图片描述

试着把机器参数和缺陷的位置进行了关系模拟。最终得出结论:对质量影响较大的是最后一道工艺的功率问题。
在这里插入图片描述

针对如何推荐每个参数的最佳取值范围,起初我们直接运行了随机森林算法进行模型训练和预测,发现该算法对部分产品模型过拟合程度过高,达不到要求。后来我们分别试验了SVM和决策树等不同算法。根据评选结果,最适合我们数据预测的算法是SVM。在进一步算法优化后,预测结果达到了很好的效果。
【结果验证】
我们在和现场工程师一起对数据挖掘算法的结果进行了理论验证。在一致通过后,我们进行了真机模拟。试验结果取得了较好的产品质量。
【下一步工作】
目前算法在推荐了每个机器参数的最佳取值范围后,还需要人为手动输入到机器控制板进行调整。这主要受限于PLC的安全保护,不能轻易允许数据写入。随着技术的演进,我们下一步将尝试如何让系统通过OPC把PLC的机器参数动态进行调整。

本案例中,我们只对本部分数据进行了定向性挖掘。过程中我们也尝试横向数据挖掘,比如我们注意到合格率和操作时间也有一定关系。不过这不是本次分析的重点,在我们分析中没有深入下去。

在这里插入图片描述


http://chatgpt.dhexx.cn/article/FWAqlg45.shtml

相关文章

[数据挖掘案例]逻辑回归LR模型实现电商商品个性化推荐

目录 一、问题描述 二、数据摸底 三、数据清洗和特征筛选 3.1 数据抽取和清洗 3.2 特征筛选:决策树 3.3 特征分布转换 3.4 特征共线性检查 四、模型搭建 4.1 数据集 4.2 模型训练 4.3 模型验证 五、模型上线效果跟踪 一、问题描述 在电商平台中&#xff…

数据挖掘案例(2):用户画像

内容分为两个部分:     第一部分:用户画像概述     第二部分:用户画像案例 数据和源码 移步到Github : https://github.com/Stormzudi/Data-Mining-Case 邮箱:442395572qq.com 目录 第一部分:1…

数据挖掘案例实战:利用LDA主题模型提取京东评论数据(一)

泰迪智能科技(数据挖掘平台:TipDM数据挖掘平台)最新推出的数据挖掘实战专栏 专栏将数据挖掘理论与项目案例实践相结合,可以让大家获得真实的数据挖掘学习与实践环境,更快、更好的学习数据挖掘知识与积累职业经验 专栏…

数据挖掘案例实战:利用LDA主题模型提取京东评论数据(二)

泰迪智能科技(数据挖掘平台:TipDM数据挖掘平台)最新推出的数据挖掘实战专栏 专栏将数据挖掘理论与项目案例实践相结合,可以让大家获得真实的数据挖掘学习与实践环境,更快、更好的学习数据挖掘知识与积累职业经验 专栏…

数据挖掘学习(四)——常见案例总结

笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为…

数据挖掘实例1:亲和性分析示例(代码、注释、运行结果)

前言 本实例采用python3环境,编辑器采用Jupyter Notebook,安装使用方法请参考,本实例中所用到的附件内容放在文末,如果想要自行运行一下代码,可以尝试一下。 Jupyter Notebook介绍、安装及使用教程 亲和性分析示例 …

Python数据挖掘 数据预处理案例(以航空公司数据为例)

Python数据预处理 一、内容: 1、数据清洗 2、数据集成 3、数据可视化 二、实验数据 根据航空公司系统内的客户基本信息、乘机信息以及积分信息等详细数据,依据末次飞行日期( LAST_FLIGHT_DATE),以2014年3月31日为结束时间,选取…

Axure 9.0.0.3712 授权码

更新日志 2020年8月4日,Axure 更新了最新的版本,本次的版本号为 Axure RP 9.0.0.3712,具体更新内容如下: 自从Axure发布了9.0版本以后,很多小伙伴之前使用的注册码已经失效了,为了不影响想体验的小伙伴&am…

axure8.1 授权码

Licensee: University of Science and Technology of China (CLASSROOM) Key: DTXRAnPn1P65Rt0xB4eTQ4bF5IUF0gu0X9XBEUhM4QxY0DRFJxYEmgh4nyh7RtL 原文链接:http://blog.csdn.net/quanqinyang/article/details/78217464

关于Axure RP 的授权,我猜你还想知道......

Axure RP发展到今天,已经出到9的版本,当然破解授权码层出不穷。 有条件的朋友建议使用正版,可以避免以后可能出现的一些问题。 关于Axure授权码,有几点给大家说明一下。 一个Axure RP 的授权码是否可以多个人使用? 一…

2019年最新最全香港5大银行开户条件及攻略

跑去香港开户的同学,大概都了解,现在香港银行开户已经越来越严格了。银行工作人员要么就以资料要审核委婉拒绝,要么就要求客户存入几百万的存款才肯开户。2019年货币贬值加速,港币美元升值。户开开与各大行银行经理联合给大家总结了香港的5大最常见银行,汇丰、渣打、中银、…

2019年香港银行开户条件有哪些?个人账户申请被拒绝后该怎么处理比较好!!!

网上关于香港银行开户的攻略很多,但是由于政策跟银行系统不断升级的问题,银行已经全面出新政策了,为此,小编这次专门跑了一圈香港,整理了最新的一份开户大全,有评星,有体验。历史上关于香港各大银行开户的攻略都在这里了。各位有需要的小伙伴看这里,关于香港各大银行开…

一定要收藏!!!2019取消管理费最新最全香港开户攻略

自2019年8月1日起,很多香港银行相继取消多个账户管理费,香港开户难度也再度提升,还流传汇丰银行对于内地旅客来香港开户不能获批的消息,但多位在香港的中资和外资银行人士在接受媒体采访时表示暂无收到相关通知。不管怎么样!卡君还是提醒有需要开港卡的尽早开户!!!防范…

说说香港银行开户的一些细节问题

很多人对“香港银行开户”存在很大误区,认为还可以轻松地通过视频异地开户,或简单地带上公司注册文件和身份证到香港银行柜台办理手续,一两周就能拿到银行账户。 实际上2012年汇丰事件后,一石激起千层浪,银行业界人心惶惶,谁都不想成为下一个“幸运儿”,现各银行纷纷加…

测试用例的基本方法

什么是测试用例 测试用例的定义 测试用例是执行测试的依据,把测试系统的操作步骤用文档的形式描述出来 1:测试用例是为达到最佳的测试效果或高效的揭露隐藏的错误,而精心设计的少量测试数据,包括测试输入、执行条件和预期的结果…

几种测试用例方法

针对穷举场景设计测试点 针对限定边界规则设计测试点 对多条件依赖关系进行设计测试点 对于项目业务进行设计用例 1、等价类划分法:针对穷举场景设计测试点 1)说明:在所有测试数据中,具有某种共同特征的数据集进行划分 2&#xff…

设计测试用例的方法

目录 一、根据需求去设计测试用例 二、具体的设计测试用例的方法 1.等价类 2.边界值 3.因果图法 4.正交法 5.场景法 6.错误猜测法 三、如何评价测试用例的好坏 一、根据需求去设计测试用例 验证需求的正确性。 分析需求,细化需求,从需求中提炼…

设计测测试用例的五大方法

目录 一.等价类 1.等价类的概念 2.等价类的分类 (1)有效等价类 (2)无效等价类 3.使用场景 4.例子 二.边界值 1.边界值的概念 2.例子 三.因果图法 1.因果图法的概念 2.因果图中的逻辑图 3.因果图设计测试用例步骤 4.…

bat简单的批处理命令

授人以鱼不如授人以渔 如何查看dos命令帮助 命令名 /? 路径使用 \ 不能使用/ 例如查看del命令帮助 1. echo 显示信息,关闭、启用命令回显 echo hello关闭回显 echo off echo hello开启回显 echo on2. 关闭当前语句回显 3. del 删除一个或多个文件 /p 删除…

.bat 是什么? (批处理脚本)

批处理(Batch),也称为批处理脚本 windows下Bat命令学习 一、基础语法: 1.批处理文件是一个“.bat”结尾的文本文件,这个文件的每一行都是一条DOS命令。可以使用任何文本文件编辑工具创建和修改。 2.批处理是一种简单的程序,可以用…