智能运维 VS 传统运维|AIOps服务管理解决方案全面梳理

article/2025/8/30 7:19:26

云智慧 AIOps 社区是由云智慧发起,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交流社区。该社区致力于传播 AIOps 技术,旨在与各行业客户、用户、研究者和开发者们共同解决智能运维行业技术难题,推动 AIOps 技术在企业中落地,建设健康共赢的AIOps 开发者生态。

运维服务管理的问题与挑战

数字化转型背景下的IT运维

随着业务的不断创新发展,敏捷开发、容器化、云计算等新技术的应用越来越多,与此同时,业务系统架构也变得越来越复杂,传统运维工作将会面临更多、更大的挑战。因此,确保 IT 系统的持续健康是保障用户体验和业务发展的基础。在上述背景下,云智慧将运维存在的挑战分为人员、流程、技术三个维度:

  • 人员方面:现阶段,IT运维人员总是被动开展工作且重复性操作较多,在面对数百上千设备以及快速迭代的技术栈时,因缺乏标准化的管理,使得愈加庞大的业务系统难以应对;
  • 流程方面:IT运维类的管理制度标准化程度不足;运维人员工作负荷也难以量化体现且缺乏认同感。
  • 技术方面:在面对庞大的设备和系统数量时,企业缺少自动化技术手段进行管理,导致企业对业务系统的可用性预警不足,运维工作被动。

IT运维中面临的现状与痛点

基于上述对运维背景及挑战分析,云智慧将企业 IT 运维典型问题归纳总结为以下几个方面:

  1. 流程与制度不完善,存在沟通灰度;
  2. “建转运”过程不规范,效率低,运维工作量化能力弱,无法形成考核依据;
  3. 缺乏运维知识沉淀;
  4. 缺乏 AI 技术在运维服务管理中的应用。

新一代IT服务管理是业务与技术发展的必然

在上述的挑战下,运维服务管理的理论和工具都有了新的变化。ITIL 4 引入了服务价值体系的概念,它可以为组织提供一个强大的、统一的、以价值为中心的方向。随着企业数字化的转型和发展, IT 服务共享中心正在成为企业 IT 的重要服务支点,如何在工具中体现对共享服务型组织的支撑,成为了新一代ITSM 的重要方向。 在今年的 ITSM 工具关键能力报告中, Gartner提到了一个重要的能力-AITSM,即人工智能在 ITSM 中的应用,例如基于人工智能的虚拟助理机器人,为用户提供对话式自助IT服务;结合知识库实现自动解决方案推荐;基于深度学习的类似工单等应用场景。以上均为新一代 ITSM 的技术发展和应用。

此外,ITIL 4 在新时代客户体验、价值流和数字化转型的背景下,重新提炼了更多的 ITSM 实践,也采用了新的工作方法(如精益、敏捷以及DevOps),也促使 ITIL 跟上了新时代。云智慧在理论和前沿技术的指引下,推出了云智慧数字化服务管理解决方案。

解决方案

  • IT服务管理体系—夯实组织信息化建设基础

数字化运维的完整场景为当业务用户方提出服务需求时,IT运维组织则会通过各种管理流程和活动来提供服务促进价值共创。 一个企业信息系统价值的实现,30%在于建设,70%在运维,稳定运行才能发挥业务价值。 数字化运维服务管理的核心价值在于标准化、规范化、精细化管理。 从业务用户角度出发,便捷地申请服务请求、申报故障以及提出新需求是他们关注的重点。与此同时,问题解决过程快速,过程可视化,对于业务用户来说也是良好的服务体验。以上过程的实现背后则需依赖于科学的管理流程和运维组织支撑。 从IT运维组织角度出发,规范化、可量化IT服务则是重中之重。因此,运维管理则需要提供服务目录以及考核运维流程指标。此外,配置管理也是整个运维场景中的核心要素,它会为其他流程提供配置项信息数据,支持其他流程运转。例如,在变更管理流程中,配置管理可以提供变更影响分析,帮助评估变更风险和召集变更评审人员;同时,配置管理也为运行综合分析和自动化作业、容量管理等场景提供基础数据。

  • 分层设计的产品架构,不断改进优化产品

基于上述的理论知识和用户实践场景,云智慧研发了数字化运维管理系统(DOSM)和CMDB两款产品,从产品维度云智慧将其分为了两个产品线,在实际落地的使用场景中,这两者亦是松耦合关系。

下图架构图从系统技术实现的维度来介绍数字化运维平台的产品能力和功能模块。云智慧将产品所要实现的具象功能,抽象为一个个彼此独立又互为关联的模块,并将这些模块根据业务及数据逻辑进行分层组合。

  • 系统设置层:提供了通用性的系统自身管理能力,包括统一用户中心和日志审计,接口能力等;
  • 能力引擎层:是DOSM的核心能力层,为整个产品的流程、表单、消息通知、搜索、内容聚合打下基础;
  • 业务设置层:是一些业务功能的配置和实现的能力,如运维管理流程的配置,以及一些通用业务,如例行工作、值班等;
  • 功能模块层:数字化运维服务管理功能落地,提供标准流程和表单模板,日常运维小工具等;
  • 统一门户层:提供了个性化的内容聚合、大屏数据展示、报表报告分析等功能。

下图右侧是与云智慧自身产品或第三方产品的集成能力,包括ChatOps机器人、自动化产品、监控工具、门户、告警中心、移动平台等。

  • 专业化、标准化的IT共享服务中心,降本增效

IT 共享服务中心是 IT 服务管理的一个重要场景,也是IT集约化发展的一个表现。现如今很多大型企业组织都在将 IT 独立出去,促使其从成本中心走向利润中心,共享中心不再仅仅为一个特定的业务服务,而开始考虑服务成本。以上则必须先通过标准化服务来提升服务质量和效率,降低服务成本。从整个企业组织层面来看,IT共享服务中心可以避免重复建设 IT 服务管理平台和人员投入。对内,统一管理基础架构和资源可以有效地支撑组织业务运转; 对外,提供标准化的服务能力和流程共享(如资源申请,账号开通,业务报障等)可以实现IT服务端到端的价值交付,从而提升数字化体验,以及赋能业务发展。

  • 内置最佳实践,快速帮助企业规范化IT服务管理

云智慧数字化运维服务管理产品,基于ITIL 4最佳实践,内置了多个ITIL标准管理流程,包括事件、问题、变更等多个常用流程,从而降低了用户配置难度,让用户能够快速上手实践。此外,产品还支持本地化私有部署和SaaS购买模式,本地化部署现在已完全支持容器化部署,具备了更便捷的部署和服务扩展模式。

以上ITIL中的常用流程均可以在云智慧数字化运维服务平台中开箱即用,以此帮助企业组织高效处理、规范运维过程。下面为几类高频运维场景实例:

  • 服务请求:主要是对外提供标准化服务,像申请虚拟机、邮箱扩容、域账号重置等,标准化的服务请求可以让A和B用户同样的服务体验;
  • 事件管理:目标是快速恢复业务,第一时间解决故障,尽量减少业务中断时间;
  • 问题管理:主要目标是查找根因,找出解决方案。流程主要是通过重现故障,调查分析,找到解决方案;
  • 变更管理:变更是运维中的常见场景,变更是为了解决故障,提升可用性。该流程主要是做变更风险评估,变更方案评审,业务验证等一系列流程动作。

  • 多渠道的提单入口,提升用户报单体验

对于终端用户来说,系统的易用性是能够推广出去被广泛使用的基础。云智慧数字化运维服务管理平台提供了多渠道服务入。云智慧 DOSM 采用了 H5 技术,实现了所有移动终端和应用一致的用户体验。此外,在移动端云智慧可以支持:企业微信、钉钉、飞书;方便用户随时提交工单同时也方便运维人员能够移动处理和审批工单活动。在PC及Web页面,云智慧 DOSM 拥有云小慧机器人; 同时,云智慧 DOSM 还支持与监控系统、告警中心以及第三方系统的集成,从而实现了自动生成工单的功能。

  • 智能的虚拟助理,提升用户自助服务体验,减轻一线工作量

云智慧在新一代ITSM中人工智能在运维服务管理中的应用也走到了业界的前沿。基于此,云智慧研发了虚拟服务助理(云小慧),云小慧本质上是一个ChatOps工具,支持多轮自然语言对话的机器人。内置在DOSM中,可以让用户以对话的方式直接获取服务或者帮助用户提报工单。 在传统 ITSM 体验中,用户需要非常复杂的流程才可以完成工单提交(通过打开网页->输入DOSM域名->找到需要的服务目录->新建并填写工单->提交工单),而云小慧则通过全新的服务获取方式,让用户与ITSM系统的交互方式有了一个巨大的变革。通过云小慧,用户可以直接以自然语言在对话框中说出需求,随后人工智能则会自动回答或提报新的工单。

  • 可视化的服务过程,让流程进度一目了然

IT服务对大多数业务用户来说,是一个黑盒子。业务用户提出需求工单后,无法通过可视化的服务进程跟进工单详情,致使用户体验度较差。因此,云智慧DOSM提供了工单过程的可视化跟踪管理,用户可以了解工单的进度,还可以在工单中与运维支持人员快速进行文字沟通,高效处理工单。

  • 交互式的服务台,提升服务体验

服务台在IT组织中,除了存在物理组织,还有一些是虚拟化的组织,甚至还有机器人服务台。服务台作为企业组织IT服务的统一入口,是一个管家的角色。用户除了可以通过服务台获取IT服务,还可以搜索知识库自助解决问题。云智慧的DOSM内置了一个真实的服务台模块,帮助企业管理用户和呼叫中心的坐席人员。 坐席人员可以通过DOSM的Web端即时或延时响应用户,第一时间解决问题或将无法处理的工单分派到后端的运维支持组织,并反馈结果给用户。此外,坐席人员还可以直接点击聊天信息,根据用户的问题在聊天界面的知识库搜索和推送知识。与此同时,用户方可以在Web页面,或者通过即时通讯工具中的云小慧机器人找到人工服务,关联用户信息并创建工单。

  • 多级服务目录,标准化IT服务能力

云智慧DOSM支持多级服务目录,可以对IT部门提供的所有服务进行分类目录,用户可以通过目录快速获取服务。部分标准服务请求可以结合自动化技术,实现自动交付,从而提升服务能力,降低服务成本。如标准化的虚拟机申请、网络端口开通、服务启停等。

  • 灵活的服务级别协议,保障IT服务质量,量化运维人员工作量

服务级别协议是服务量化的基础。云智慧DOSM支持灵活的SLA设置,通过测量流程节点间或全流程的耗时,来确保服务在约定的时间里完成。此外,DOSM的逾期提醒和升级处理机制,也进一步保证了服务能够按时交付。

  • 灵活的表单和流程设计,快速定制企业专属流程

ITSM管理工具众多,市场中有超过400个不同的产品。从最基础的帮助台工单工具到高级的自动化的工具,都号称能支持用户自定义流程设计,而各工具间也有较大差距。流程引擎的灵活性,表单模板的易用性,支持的字段类型是否支持触发器,外部接口调用等功能,都决定了用户在使用工具自定义管理流程的可行性和难易度。在DOSM2.0版本中,云智慧将表单设计模块的组件进行抽离,支持通过拖拉拽的方式在表单画布上进行设计,提升了产品的易用性;此外,云智慧DOSM基于Activiti流程引擎,支持分支流程、并行流程、子流程等多类流程;内置10+表单字段类型,支持字段分组、字段联动以及工单属性页配置,全面满足工单定制要求,可以快速帮用户实现新流程的落地。

  • 分类的运维知识库,沉淀运维经验,提升运维效率

知识库在ITIL中是一个重要的模块。知识库可以在管理中持续发挥价值,帮助用户自助服务,提高服务台首问解决率,降低整体运维的人员成本,沉淀运维组织经验。 云智慧DOSM内置的知识库,可以结合智能机器人和即时服务台,帮助用户尽快解决问题; 知识库本身也支持了富文本内容编辑,知识的导入导出,知识的审核、发布流程,确保知识的准确性。

  • 灵活的报表分析组件,挖掘运维数据价值

针对流程的KPI和日常管理的运维指标,云智慧DOSM除了提供开箱即用的ITIL常规报表之外,还支持用户进行自定义报表,指定数据源,报表字段和展现方式,进行自定义,同时也支持对报表进行排期,定期发送报告。

  • 统一的 CMDB ,打造动态可靠的配置信息库

CMDB是指包含每个配置项及配置项之间重要关系的详细资料的数据库,管理所有配置项及其关系,以及与这些配置项有关的事件、问题、变更和发布等信息。CMDB作为IT服务管理里面的核心配置库,会为其他流程为其提供信息,如变更管理流程提供的有关IT组件变更的信息、采购流程提供的有关IT组件采购信息。此外,CMDB也为自动化操作提供目标信息,并记录执行历史。

云智慧CMDB可以支持数据联邦、调和和同步;灵活的信息模型定义;支持自动发现;具备完善的API调用接口,进行数据共享。

  • 准确的配置管理数据,助力多种运维场景

所有CMDB所管理的资源一定要有使用场景是建设CMDB的核心逻辑关系。要想各种场景被正确执行,就会要求CMDB所提供的资源是准确且实时的;这样运维人员才会有动力去努力维护和更新CMDB的数据,以确保运维的工作能够顺利开展。

在做故障分析过程中,需要根据配置项管理所提供的基础架构配置方面的信息分析问题和已知错误与配置项之间的关系,并根据配置管理数据库中的信息对事件和问题进行调查和分析,如通过比较基础架构的实际配置与配置管理数据库中的被批准的配置来发现基础架构的缺陷。此外,如果企业需要做大屏数据展示分析,CMDB可以提供数据支撑。

  • 自动发现,流程控制,数据审计,保障配置数据的准确性

当下有很多企业组织在建设CMDB时最终效果均不是很理想,甚至到后来会慢慢废弃。这其中最大的一个问题就在于配置项数据的准确性不够。数据不准确,CMDB使用价值就越来越。而云智慧主要靠自动发现、流程控制、和数据审计来解决数据鲜活、准确的问题。

  • 自动发现:可自定义采集模板,内置20+种配置项自动采集脚本;
  • 配置管理流程:通过流程控制,确保入库的数据是准确可信的;
  • 数据审计:通过多源数据比对,数据同步日志监控,同源数据定期校验等方式。

  • 对接告警系统,问题处理更及时

DOSM对接告警系统实现了基于告警事件的自动以及手动创建工单,使告警处置工作更加流程化与标准化。 同时云智慧的产品支持在创建告警工单时自动生成告警详情并自动关联配置项,大大提高了故障根因分析和故障处理的效率。在多数情况下,监控工具出来的告警并没有业务信息、管理员等重要数据,这些都需要CMDB的数据进行补充和丰富,这样出来的告警信息能够帮助运维人员更快速地了解告警的严重程度,从而更快速地处理故障。

云智慧的价值与优势

  1. 形成完备的解决方案与服务体系

云智慧运维咨询涵盖运维各领域体系建设与专项咨询。围绕ITSM落地的三驾马车( ITSM&CMDB管理咨询、ITSM&CMDB工具以及实施交付)打造了全套、全流程的解决方案与服务体系。通过与业界顶级合作伙伴一起完成新一代ITSM工具 ——DOSM&CMDB的落地与交付实施。此外,云智慧提供全面的解决方案,以ITSM、CMDB咨询服务为核心服务体系,在顶层给予企业客户专业指导。与此同时,云智慧融合了DOSM、CMDB等标准产品,将顶层规划融合产品进行落地实施,从而将理念转化为现实。

  1. 提供一站式 ITSM 管理咨询服务

云智慧可以提供一站式ITSM管理咨询服务,主要包含以下几方面:

  • 权威授权:AXELOS官方授权的中国首家IT服务管理咨询合作伙伴;
  • 标准制定:中国智能运维国家标准制定单位之一;
  • 专业团队:咨询顾问来源于世界500强企业或者专业咨询公司,人数20人以上;
  • 经验丰富:资深顾问平均从业超过10年以上。

  1. 统一运管服务、提升服务价值
  • 价值总结:降本增效;
  • 规范流程: 赋能内部运营过程,提供流程化的综合管理平台;通过采纳最佳实践,提高IT内部服务水平,以及服务级别的持续保持; 根据IT的组织架构明确运行维护流程。
  • 提高质量,提升效率:完善知识库功能及行业运维知识积累; 大大缩短故障处理周期; 让行业核心技术人员摆脱重复性工作,专注技能提升。
  • 提高客户满意度: 为服务台管理员提供调查工具,用以征求客户对相应服务水平的满意度反馈,从而提高客户满意度。 明确日常工作目标,建立以客户为中心的服务体系。
  • 建立标准服务管理模式: 建立行业IT服务管理运转模式,明确IT服务管理的服务计量。 通过自动处理加快问题解决过程,使IT各部门提高生产效率、改进服务交付的能力,为关键业务服务提供稳定、高质量、低成本的可靠的服务。

开源福利

云智慧已开源数据可视化编排平台 FlyFish 。通过配置数据模型为用户提供上百种可视化图形组件,零编码即可实现符合自己业务需求的炫酷可视化大屏。 同时,飞鱼也提供了灵活的拓展能力,支持组件开发、自定义函数与全局事件等配置, 面向复杂需求场景能够保证高效开发与交付。

点击下方地址链接,欢迎大家给 FlyFish 点赞送 Star。参与组件开发,更有万元现金等你来拿。

GitHub 地址: https://github.com/CloudWise-OpenSource/FlyFish

Gitee 地址:https://gitee.com/CloudWise/fly-fish

万元现金活动:http://bbs.aiops.cloudwise.com/t/Activity


http://chatgpt.dhexx.cn/article/YhZNErGh.shtml

相关文章

AIOps中的四大金刚

作者简介 运小青 百度云资深研发工程师 负责百度云智能监控、智能故障自愈方向架构设计与研发,推动AIOps的实践与落地。 干货概览 AIOps(Artificial Intelligence for IT Operations ),即智能运维,是将人工智能的能…

什么是AIOT?

AIoT(人工智能物联网)AI(人工智能)IoT(物联网)。AIoT融合AI技术和IoT技术,通过物联网产生、收集来自不同维度的、海量的数据存储于云端、边缘端,再通过大数据分析,以及更…

AIOps:实现运维智能化的一大利器

出品 | CSDN云原生 AIOps由Gartner于2016年提出,旨在使用大数据、机器学习等方法来提升运维能力,其目的是进一步降低自动化运维中人为干扰,最终实现运维无人化、自动化。 CSDN云原生系列在线峰会第16期“AIOps峰会”由用友畅捷通助理总裁熊昌…

AIOT介绍

百度词条的解释:AIoT(人工智能物联网)AI(人工智能)IoT(物联网)。AIoT融合AI技术和IoT技术,通过物联网产生、收集来自不同维度的、海量的数据存储于云端、边缘端,再通过大…

AIOps

自 Gartner 于 2016 年创造 AIOps 一词以来,人工智能已成为先进技术世界的流行语。AIOps 的目标是自动化复杂的 IT 系统解决方案,同时简化其操作。 简单地说,AIOps是一种转型方法,它使用机器学习和AI技术来运行诸如事件关联、监控…

AIOps是什么?为什么用它?

由于快速的数字化转型给 IT 企业组织带来了很大的压力,要求他们更加主动和敏捷,DevOps 原则和实践一直是宝贵的资源。但是,为了保持领先地位,企业需要更强大的解决方案。那么,答案是什么?当然是 AIOps&…

AIOPS是什么,它的未来如何?

AIOps,也就是基于算法的IT运维(Algorithmic IT Operations),是由Gartner定义的新类别,源自业界之前所说的ITOA(IT Operations and Analytics)。我们已经到达了这样的一个时代,数据科…

AIOps基本概念以及能力分级

一、概念 AIOps是Artificial Intelligence for IT Operations,智能化运维。 简单说, AIOps AI 运维数据 自动化处理 AI Devops 终极目标:“有AI调度中枢管理的,质量、成本、效率三者兼顾的无人值守运维,力争所运营系统的综合收益最…

AIOps介绍

AIOps介绍 AIOps是指人工智能运维(Artificial Intelligence for IT Operations)的缩写。它是将人工智能(AI)和机器学习(ML)技术应用于IT运维领域的一种方法。 传统的IT运维通常需要人工监测和管理大量的系…

智能运维(AIOps)系列之一:个人对智能运维的理解

前序 本人从事了 5年 的智能运维开发,把这几年的想法和思路在此跟大家分享一下,主要是为了起到抛砖引玉的作用。该序列总共5部分: 智能运维系列之一 — 概述:主要是讲述自己对智能运维的理解;智能运维系列之二 — 什…

使用TimerTask的坑

使用TimerTask可以方便的实现定时任务的功能,但是如果使用不当,反而会带来隐患。 在使用TimerTask时,TimerTask中的代码必须要做异常处理,否则产生异常的时候,就挂掉了。 特别像使用MQ发送数据的时候,不会…

Timer和TimerTask与线程的关系

1. Timer是一个定时器,它可以根据指定的时间,指定的执行周期来执行固定的任务TimerTask,例子如下: Timer与线程的关系,在Timer源代码中可现如下代码: 1. 以下为Timer的默认构造方法,起调用了自…

Java通过Timer与TimerTask实现定时任务调度

java通过Timer、TimerTask实现定时任务调度 文章目录 java通过Timer、TimerTask实现定时任务调度前言一、什么Timer类二、什么TimerTask类三、代码实现定时调度1.创建DuTask类2.创建测试TestDuTask类 总结 前言 在实际的工作当中,经常要用到定时去操作一下任务&…

Java的Timer和TimerTask怎么结束

java中自带的定时器有Timer和TimerTask,但是运行起来要结束任务用cancel方法可以结束该任务,此时Timer线程还在运行,程序并没有退出,那么怎么结束Timer呢? 示例代码如下 public class Test {public static void main…

TimerTask类和Timer类的cancel()方法详解

无论是TimerTask类还是Timer类,其cancel()方法都是为了清除任务队列中的任务。虽然都是清除任务队列中的任务,却有一些不同:TimerTask类中的cancel()方法侧重的是将自身从任务队列中清除,其他任务不受影响,而Timer类中…

java 定时器Timer和TimerTask的详解(执行和暂停)

目录 1:java.util.Timer定时器的常用方法如下: 2:参数含义: 3.暂停任务: 4.例子: 1:java.util.Timer定时器的常用方法如下: schedule(TimerTask task, long delay) // 延迟delay…

Java定时任务Timer、TimerTask与ScheduledThreadPoolExecutor详解

目录 一、Timer和TimerTask 1、快速入门 2、schedule与scheduleAtFixedRate使用方法 3、schedule与scheduleAtFixedRate区别 4、终止Timer线程 5、Timer线程的缺点 二、ScheduledThreadPoolExecutor 1、构造方法    2、调度方法 3、与Timer相比,优点 定…

TimerTask

详解java定时任务 在我们编程过程中如果需要执行一些简单的定时任务,无须做复杂的控制,我们可以考虑使用JDK中的Timer定时任务来实现。下面LZ就其原理、实例以及Timer缺陷三个方面来解析java Timer定时器。 一、简介 在java中一个完整定时任务需要由Time…

Java Timer TimerTask示例

Java java.util.Timer是一个实用程序类,可用于调度将来某个时间执行的线程。Java Timer类可用于计划要一次运行的任务或定期运行的任务。 Java TimerTask java.util.TimerTask是一个实现Runnable接口的抽象类,我们需要扩展这个类来创建我们自己的Timer…

Timer+TimerTask实现数字时钟

成果展示 布局 布局主题背景颜色采用#000000(纯黑色),各TextView字体颜色采用#FFFFFF(纯白色)。 使用五个TextView,分别实现小时:分钟,秒钟,am,pm,周日,具体…