于栖洋 译
摘要:本文概述了工业4.0中集成人和信息物理系统的设计和使用空间,特别关注分析、设计和评估方法和阶段的相互作用。本文首先介绍了工业4.0面临的挑战,综述了现有的系统设计方法,描述了方法模型的设计和使用空间,并以工业4.0为例进行了举例说明。推导了一种迭代分析、设计和评价的扩展u型方法,从理论上进行了描述,并以实例进行了说明。展望确定了未来设计和评估方法的潜在路线图,特别是工业4.0。
关键词:人机合作;设计与评价方法;cyber-physical系统;4.0行业
1引言
工业4.0预示着下一阶段的工业革命,工业生产的一体化和生产率将更高,但同时也给政治、研发、雇主和雇员带来了一些挑战(例如[1],[2])。
使用适当的概念和方法可以在成功或失败地管理一个工业项目之间产生本质的区别。这个选择不是微不足道的,特别是在工业4.0这样的剧烈变革时期。在科学领域,人们面临的挑战是如何及时开发出合适的、科学上合理的方法,为成功地管理这些项目提供必要的、有用的指导方针,从目标的制定、假设的定义到关于假设的数据和结果的分析,等等。深度数据分析可以引导系统设计师和工程师确定结果的合理性,或者可以采取的新方向。
在我们研究新的方向之前,让我们先看看已经存在的东西。一些以用户为中心的设计方法已经出版,目的是增加系统的人机工程学。他们提供关于界面设计和评估的知识,例如,可用性和基于认知行为的人机交互模型。Nielsen将可用性定义为可接受性的一部分,可接受性是指产品符合客户期望的程度。Gould和Lewis将可用性工程描述为一种有三个策略的通用方法:在早期考虑用户和他们的任务,经验度量和迭代设计。
这种方法在项目管理的大多数步骤中都包含了用户方面,并定义了几个规范。然而,还有其他的方法,这些方法来源于不同的领域,例如社会可接受性中的方法。Brangier等人提出了社会和人体工程学方法[5]的比较。作者强调了利用它们的互补性的兴趣。这也是Millot提出的方法,即“U”[6]中的方法。该方法以[7]的V-cycle或V-model[8][9]为出发点,旨在提出一种更简单的方法来设计和评估系统。该方法起源于系统工程,是基于叶栅模型的不同阶段而建立的。然而,该模型很难应用于复杂的环境,如动态环境,这是我们研究的主要应用领域。此外,它没有考虑到人类及其与辅助系统的交互。“U”中的方法就有这个目标,并且以合作的方式在控制过程中平衡人的参与和机器的参与。
在德国的一个平行研究流中,专注于合作系统和迭代的、参与式的设计方法,在几个研究项目(如[10])中开发并迭代地精炼了一个人类系统探索的范例。中心思想是,与V型或Ushaped方法相比,在这种“探索涡轮机”中,需要多次迭代来探索设计和使用空间的多种组合,将设计和工程行动与估计或测量效果的行动相结合。探索式涡轮机的另一个中心思想是,基于最初的想法,它首先打开探索的可能性领域,然后再缩小到具体的设计,原型和结果(如[11])的选择。
2 迭代设计、开发和测试
经过十多年卓有成效的科学讨论,这两个模型被融合在一起来解释人类信息物理系统集成(HIS)的不同阶段。图1给出了基于四个主要特征的迭代过程:设计阶段、评估阶段、可能性域和迭代次数。螺旋式的改进使人们注意到在人类信息物理系统(HCPS)设计开始时的长设计和评估阶段,因为有大量的可能系统可以满足目标。然而,越多的探索者和实验者重复这个过程,他们就越少可能的系统的数量,并且迭代阶段变得越短。
图1.具有螺旋细化的迭代过程[12]
3 U模式的拓展
该方法最初应用于远端机器人领域[13],其他领域如汽车领域[14]也应用了该方法。图2给出了该方法的新版本。实际上,关于通过任务描述的人和机器表示的细节、它们通过公共工作空间的交互以及多层次的合作丰富了之前的版本。在这种方法中,一个下降阶段设计HCPS,一个上升阶段评估它。下降阶段的所有步骤都使用了合作主体、合作层次和合作层次的模型,以及几年前在处理人机系统设计的工作中定义的公共工作空间的概念。关于详细的介绍,读者可以参考下面的文档[15],[16],[17];然而,这些定义被简要地介绍和解释了整个方法的描述,以工业为重点,解释了它们的有用性。
在第一阶段,设计师应该理解和确定他们必须设计的人-信息-物理系统的目标(参见图2-1)。目标通常描述的是性能的提高,但性能是一个隐藏了很多东西的通用词。它可能是空中交通管制员能够管理的飞机数量的增加,驾驶辅助系统的道路上死亡人数的减少,制造系统产生的产品数量的增加。然而,性能也意味着人类在其活动中有更好的舒适度或更大的能力,例如增强身体或认知能力或补偿虚弱或残疾的系统。在工业4.0的背景下,如何使CPS适应操作员的专业技能、经验技能、当前或特定过程状态下的普通或暂时的心理和身体能力,已经是行业的要求。因此,系统设计者必须在与管理者和专家的讨论中正确地识别和理解目标,但大多数时候,与未来的最终用户进行讨论也是有用的,特别是对于方法的下一个步骤,关于过程的分析(参见图2-2)。
过程和人类活动处理这个过程的控制通常不是新的;它们已经存在于工业中。因此,当前组织的模型、规定的任务和功能的模型以及当前过程的详细描述可以告知设计者(参见图2-0)。很少出现的情况是,只有人类活动存在,设计者必须想象和创建系统来自动化部分人工任务。因此,设计人员必须确定他们干预的限制,这些限制由一组人工任务和经理同意修改的子任务定义。然而,如果未来的终端用户同意提高他们对新系统的接受度,特别是关于他们未来的任务,那也是很有趣的。如今,通常只有安全和安全标准才能定义这样的限制,但其他价值,如操作员的工作量或动机或道德风险必须被视为[18]。然后,设计师研究人力和技术资源(参见图2-3),并可能对当前的过程进行分析,这些分析的观点有时与管理者的观点不同(参见图2-2)。这里的目的不是为了避免管理者的影响,而是用一种中立的方法来提供新颖和原创的观点。人体工程学和社会领域有助于分析人力资源,提取与活动相关的认知和身体约束,以及来自社会组织的约束。
该方法突出了从组织中提取活动层次和合作层次的兴趣(参见图2-4)。然后,设计师必须确定每个级别的任务和人类和CPS的子任务(如作战、战术、战略),以及从一个级别到另一个级别的任务或信息(参见图2-5)。在每个关卡中,设计师建议修改当前的任务,或者为人类和CPS创造新的任务(参见图2-6)。这是一个逐级分析活动的迭代过程,以及各级之间的互补性(参见图2-7)。任务或职能处理个人活动和合作活动。在人机合作模型的基础上,KnowHow(to- operation)功能根据四个主要的子功能处理过程的控制:信息收集、信息分析、决策、行动。knowwho -to- cooperation功能根据其他四个主要子功能来处理合作交互:-收集其他agent的信息,-检测合作agent的态势感知和决策/行动之间的干扰,-这些干扰的管理,-权力的分配,以及控制过程的责任(例如[19]专有技术(操作)和专有技术协作功能可以通过一个网格来分析,以识别和定义任务和子任务[20]。
图2.扩展U方法[17]
在检查关卡之间的互补性后,设计师可以继续进行编程部分,除非他/她是在功能模拟方法的探索性部分。如果他/她在方法的实现部分,设计师可以开始编程CPS功能,编程界面(视觉,听觉,触觉)和培训未来的用户(参见图2-8)。人与CPS功能的定义和组织是HCPS设计的重要内容。然而,接口,公共工作空间的外部表示,合作活动的支持,是这样一个系统成功的另一个关键部分。不过,我们不会关注这方面,而是使用专门的文献,特别是那些旨在选择或混合不同感官感知(例如[21])的文献,以及几篇关于工业4.0的这方面的文章。在下降阶段结束时,上升阶段接管评估新HCPS的工作。
在工程方法中,这通常(错误地)与方法的“实现”有关,当HCPS有最少数量的功能要实现时,上升阶段通常开始,至少在工业过程的一个活动级别上。评估的目标必须回答所陈述的假设所提出的问题。评估中我们想强调什么?如何评估拟议的新“卫生cps”,并证明其有用性?实验程序和实验方案回答了这些问题(参见图2-9)。实验者定义情境和场景。上下文处理HCPS参与的整个或部分过程。流程和目标的起始状态定义了用户活动的全局形状。场景旨在通过要求用户(以及辅助系统/自动化)实现目标来鼓励用户完成某些任务,尽管会触发意外事件。实验协议可能涉及构建几个场景,以允许实验者比较不同的实验条件,即HCPS的不同配置或主张,如比较几个自动化级别的[22]。
场景必须是不同的,以防止用户识别情况,作出相同的决定,并与辅助系统以相同的方式交互;然而,为了使数据具有可比性,场景需要类似的任务。场景的持续时间取决于任务,在操作层面对机器人的控制可以持续几分钟,而当目标是评估工业过程监督时,则需要几个小时。大多数情况下,使用希腊-拉丁方实验设计来平衡场景和实验条件,以减少顺序和学习效果。这样的实验组织定义了实验设计,其目的是减少在评估一种类型的援助系统之前评估另一种类型的援助系统的影响,以及根据援助系统的类型来确定场景的特殊性。定义了没有新辅助系统的条件作为控制条件。这使得评估新的HCPS的潜在效益成为可能。实验设计包括定义实验程序,即实验者与参与者进行认知活动分析的各个步骤。数据处理真实或模拟CPS实验协议的定义评估的上升阶段设计的下降阶段新目标(性能、产品类型、人类评估记录模型的目标CPS和处理主观和客观的数据上下文场景分析的流程实现/集成人工训练Human-Cyber-Physical系统分析当前的人工任务共同工作空间任务分配/规则分析的一个级别的活动人力资源水平的活动/命令组织技术资源分析当前CPS的人工任务修改CPS的修改活动水平的互补性结果集定量和定性数据V验证修改更多训练部分实验。首先由实验人员提出科学目标,然后再提出实验平台。其次,如果参与者是新手,他们可能需要学习这个过程。他们可能必须确定场景(请求的任务)的上下文和类型,通常不使用新的辅助系统。因此,他们可能必须学习辅助或自动化系统如何在正式的演示中发挥作用,然后在专门的场景中使用它来训练自己。训练场景不同于实验场景,但难度相似。
真实的环境或模拟器可以支持HCPS的研究(参见图2-10)。模拟器的真实感可以从非常低的真实感(参与者只需执行非常简单的任务,但通常需要多次重复),到高真实感(模拟只涉及环境,但命令和控制系统是真实的)。更先进的模拟器可以混合仿真和现实环境和/或控制和指挥系统。模拟环境是实验人员进行实验控制的一个非常有用的工具。然而,参与者有时可能会表现出不自然的行为,因为他们知道他们的活动正在被记录,并尽最大努力满足实验者的期望。对于实验的每个阶段,设计人员和实验人员都要准备数据记录。根据实验设计和实验平台的不同,数据可以是客观的、主观的、定性的、定量的、原始的、解释的和编码的。数据记录的定义和控制对于实验人员来说是一个重要的步骤,它是获得可用数据并产生相关结果的必要条件。下一节将讨论这个步骤。
数据是更频繁地引用单词现在,,例如,大数据、数据库、数据挖掘、数据云,但实验者必须找到合适的折中记录许多数据和花很多时间清洁,选择最适当的选择和分析数据,或者数据关于目标和分析它们的方法。在线数据记录及其分析是理解HCPS活动的核心。(如图2 - 11)。设计人员可以在实验平台上直接对数据记录进行编程。所有通过human-CPS接口发送的命令和公共工作空间中的信息更新为实验人员了解过程情况和agent对这些情况的决策提供了宝贵的信息。在模拟和实验执行过程中预编码数据可以支持分析。用户工作站的自发口头报告和视频输出提供了其他类型的数据。当两个人一起做实验时,自发的口头报告特别有趣。然而,对于实验人员来说,在线口头报告有时并不容易理解。因此,除了这些报告外,实验人员还使用了自我观察报告。任务执行后,参与者观看他们活动的视频记录,并提供评论来解释(但不是证明)他们的决策。
与自发的口头报告一样,模拟环境给实验者提供了记录其他主观观点的机会,如在线参与者的工作量和情境意识。实验者通过要求参与者定期回答有关他们工作量信息的问题来评估在线工作量。问题是口头提出的,或通过在显示器上绘制比例的方式提出的。尽管这个问题对参与者来说是一个额外的任务,但它可以是一个合作任务的一部分,特别是当参与者必须评估自己的工作量来决定将任务分配给一个伙伴时。设计人员和实验人员可以将参与者对工作量的评估与系统使用不同技术进行的计算评估进行比较。情境意识的评估也是一种有用的工具,可以用来说明参与者如何感知和理解一个过程或环境,并做出决定。几种方法存在。Endsley提出了一种与她的SA[23]三级模型相关联的方法。该方法被称为SAGAT(情境感知全局评估技术)[24],用于模拟环境,包括随机冻结情境,关闭显示,并询问参与者对当前情境的理解。SAGAT已经获得了参考方法的地位。然而,它的主要局限性在于模拟过程的冻结,使其无法在实际应用中得到应用。
模拟环境允许在安全可控的条件下测试辅助系统。在现实世界中进行测试之前,需要进行这样的实验。然而,现实世界的测试涉及许多约束。事实上,在现实世界中进行的实验比在模拟环境中进行的要复杂得多,也难以控制得多,尤其是当重点放在人类- cps合作时。此外,与受控的模拟环境不同,技术问题会出现,如通信干扰或中断。即使在实际任务中也会出现这样的问题,这些不受控制的事件也会阻止进行重复的场景以提取具有统计学意义的结果。
在真实环境中评估工作量和情境感知当然比在模拟器中更有问题,除非评估工作量和情境感知是参与者任务的一部分。在工作量评估方面,Durso等人提出了一种由主题专家(SME)[25]进行的肩扛式主观评估。他们还使用了一种没有内存组件的查询技术SPAM (SituationPresent Assessment Method)。这种测量方法包括实验者“检测参与者在整合到场景中的特定事件上的错误”。对于真实情境中的情境感知评估,Jones和Endsley提出了“实时探测”方法。它包括询问一系列与三种SA水平相关的周期性问题(但不屏蔽显示),并使用参与者对问题的响应时间作为SA质量的补充指标。他们通过与SAGAT进行比较,部分验证了该方法的有效性。在线记录提供客观和主观的数据,反映人类和技术人员的活动。专注于他们的任务,人类通常没有时间重建他们对情境的理解,或者想象比他们在实验中实际记得的更多的事情。然而,它们阻止了实验人员深入分析,以理解参与者行为的原因。离线记录可以缓解这种不足,各种方法可以帮助聚合在线和离线数据。下面将详细介绍这些功能。
每次实验结束后,实验者可以再次评估工作量和情境意识;然而,问卷是线下记录的主要工具。NASA TLX (Task Load indeX)是评估参与者工作量的主要方法之一。该方法通过[26]两个阶段向参与者提出问题。在每个实验阶段或每个实验条件结束后,实验者要求参与者在10厘米的直线上画一个叉,说出他们对6个描述符的感觉。描述符包括心理需求、生理需求、时间需求、自身表现、努力程度和沮丧程度。这个问卷可能对那些专业的操作员有用,比如在工业领域。事实上,他们很好地描述了自己的工作和任务,他们也习惯用类似的问题来评估自己,特别是当他们执行有风险的任务时。调查问卷仍然是评估参与者和援助系统之间互动质量的主要工具,并且基于合作[17]模型提出了一种涉及人- cps合作的通用调查问卷。其他的问卷也可以评估参与者如何感知实验,实验环境,程序和评价。
该方法的第12步(参见图2-12)是前面所有步骤的结果。实验人员可以描述实验的HMS结果。三个主要的反馈旨在更新设计阶段的盒子。第一轮反馈(参见图2-13)验证了HMS,并根据新的成果更新了目前的人工操作、辅助系统和流程模型。第二轮的反馈(参考图2-14)突出了HMS设计中不合适的方面。因此,设计人员必须修改这些可能处理新的人工任务、新的辅助任务、新的公共工作空间或新的组织的方面。数据处理阶段和建议的工具提供了关于不合适方面的精确信息,因此设计人员准确地知道需要在哪里进行修改。第三轮反馈(参看图2-15)强调参与者必须就他们的新任务、就他们与援助系统的合作或与过程的合作接受更多的培训。
图3.三维实验设计与评价(改编自[12])
4 实验维度
作为这一部分方法论方面的结论,我们提供了一个综合的所有类型的实验,我们进行了一个三维的演示。第一种是由实验条件组成的,根据现实的情况进行描述,这是人类活动的语境和过程类型。第二个维度是关于人类行为的现实主义,即从或多或少意识到过程和新系统使用的小样本人类,到相当于所有最终用户的大样本人类。第三个维度是新制度的现实性,最重要的是新制度的成熟性。这三个维度可以帮助定义正确的实验数量和从一个实验到下一个实验的正确步骤,以确定这些实验的相关性(参见图3)。
每个维度都显示了状态的例子,但中间可能存在更多的状态。图3显示了三个轴交点的中心点,这突出了我们可以认为是实验的结束。然而,在达到这一点之前,可能存在其他几个描述几种类型的实验的点,实验者必须解释和证明他们如何从一个点到另一个点,以确保每个轴上的改进,以及后续结果的一致性。
下一步应该是实施新的系统,并培训人工操作人员。然而,当HMS的实施完成时,参与管理或使用该HMS的人员必须确保其正常运作。HMS的许多特性可能会改变和动摇其正常的功能。的确,正如三维图中的箭头所表明的那样,它们指向的是一个“未知世界”,在这个世界中可能发生许多意想不到的事件,无论是好是坏。如何系统地应对这一“未知的世界”将有望在新的未来得到研究。
5 结论与观点
讨论的起点是工业4.0所面临的挑战,特别是将人、技术和组织整合到有意义的、成功的人类cps系统中。人类和CPS是相互补充的行动者,合作实现共同目标。设计和工程方法对于这个挑战至关重要。该方法建立了一个桥梁,以建立良好的V-和u -模型,并确定迭代阶段可以和应该发生。该方法还建立了一个桥梁之间的探索,工程和实验方法结合在不同的阶段。特别是,该方法提供了一些工具来识别和指定人类和CPS的个体功能和协作功能,并支持它们与共同工作空间的合作。在几个研究项目中构建和测试了这种连接方法,现在可以在现实世界的项目中进行迭代测试和优化。
参考文献:略
康德认为“事物的属性往往与观察者有关”,实际上,事物之间的联系也与参与者有关。