关于自动化运维的那些事儿

article/2025/9/28 4:51:30

随着近年全球运维大会的火热举办,自动化运维话题被推向了前所未有地热度。自动化运维并不是炒作的概念,而是随着信息技术发展的必要趋势。“大数据”“容器”“DevOps”“微服务”……,不断涌现出新的技术,而它们都有共同的特点,大大增加了运维管理的操作单元数量的同时对系统可用性有更高的可用性要求。从IBM、BMC、HP等传统厂商各类工具产品纷纷面市到Puppet、Ansible、Saltstack等开源解决方案风起云涌,自动化运维已经势不可挡。

一、 自动化运维的定义

什么是自动化运维?很多人尝试给自动化运维下定义,“数据中心自动化(DCA)”、“开发运营一体化(DevOps)”……,始终无法形成被统一认可的概念。这里笔者对Garter对自动运维的定义进一步引深:“通过运维工具或平台,实现IT基础设施及业务应用日常任务处理和运维流程的自动化,从而提高效率和降低风险,促进运维组织的成熟和各种能力的升级”,其中:

  • 日常任务处理包括:设备发现、脚本执行、操作系统安装、配置备份、配置检查、配置变更、补丁分析和分发、作业调度等
  • 运维流程包括:应用发布流程、应用部署流程、变更流程、故障处理流程、灾备切换流程、资源交付流程等
  • 能力升级包括:变化适应能力、风险应对能力、合规遵从能力、业务运营能力、事件应对能力等

自动化运维并不是孤立建设和运行的,笔者认为自动化运维是ITOM中的一部分,如下如。“自动化”、“配置管理”、“监控”是运维管理建设的三驾马车,三者之间即相互独立,也相互联系。笔者在走访很多企业交流过程中,很多人认为这三者之间存在着依赖关系,一定要先落地其中一个才能建设另外一个。这种理解是片面的,三者的建设路径并没有严格的先后顺序,最好的做法的共同建设,共同迭代。

二、 自动化运维的分类

我们常听到面向业务的监控或者面向应用的监控,笔者认为自动化也是一样的,可以区分为“面向基础架构的自动化”、“面向应用的自动化”、“面向业务的自动化”。三个分类既有一定的关联性,也是相互独立的,有着各自的目标和场景。

1)面向基础架构的自动化

这里基础架构主要指的是IASS和PAAS这两层。面向基础架构的自动化运维是相对比较容易落地建设的,往往自动化运维也是从基础架构这个类别开始建设的。这个类别的自动化建设的主要目标是解放运维人员的工作量,如把运维工作中的日常巡检、补丁管理、资源创建等内容实现自动化、自助化。

2)面向应用的自动化

顾名思义面向应用的自动化的对象就是以应用为单位,应用中包含了各类的基础架构资源。然而面向应用的自动化并不依赖于基础架构自动化完全落地之后才能建设,在笔者为某单位落地自动化运维时,迈出的第一步就是核心应用系统的更新部署自动化,当时还没有任何基础架构层面的自动化。当然也不是说应用的自动化完全不依赖基础架构,如自动缩扩容、自动部署与配置等对基础架构的自动化程度有较强的依赖性。

3)面向业务的自动化

面向业务的自动化是IT自动化的最终目标,归结到底IT还是为业务提供服务。如果能够将IT自动化建设与业务关联起来,IT服务的价值也能很好的体现出来。当然,面向业务的自动化也有非常高的建设难度,对业务流程、业务关联性的系统化梳理往往不是IT部门能够独立完成的。

很多企业都在探索自动化运维应该怎样开展,目前仍然没有形成相对权威的自动化运维建设路线图。笔者结合“面向基础架构的自动化”、“面向应用的自动化”、“面向业务的自动化”的理念,以及过往的项目经验,妄自菲薄的为自动化运维总结一个成熟度模型,如下图。这个层级图表达了一种迭代建设的理念:每部分内容建设都不是一蹴而就的,各部分内容建设也不是强依赖关系。同时笔者认为自动运维的建设的初期应该从下面两点出发:

  • 优先考虑可以立即产生影响的工具,如那些解决重复性工作或冗余性的自动化工具;
  • 衡量自动化应该关注:提高维护效率、降低风险或提高敏捷性。

三、自动化运维的组织模式

很多公司都在招聘或培养DevOps工程师,组建自己的自动化运维团队,每家企业的组织思路都不一样。回归本质思考自动化运维并不神秘,与ERP、OA、监控一样都是一套软件系统,同样存在“需求提出者”、“软件开发者”、“最终使用者”,将这三者由谁去扮演是自动化运维组织模式的关键。笔者借鉴工行侯志荣《一体化一体化和自动化运维体系探索》一文中的观点,在企业自动化运维建设的组织模式,大致有如下几种情形:

组织模式一:分散式

由各领域、各部门根据需求自行建设,“需求提出者”、“软件开发者”、“最终使用者”都是同一组人。这种自给自足的建设方式没有统一规划,可能使用不同的技术站,也会出现重复建设。很难形成合力,各自为营的局面往往会产生维护成本高,也可能会带来生产系统稳定性风险。

组织模式二:集中式

这是一种中央集权的组织方式,独立组织一组人员投入自动化运维建设,其他团队作为需求提出者提出需求。这种模式可以统一规划和设计,也相对更专业。但集中式的组织模式不容易调动其他团队的积极性,繁杂的运维需求很难准确收集,无法快速应对不断变化的运维需求。

组织模式三:平台式

这种模式综合了分散式和集中式的特点,组织一个团队负责自动化基础平台建设,各域、各部门根据需求自行在平台上开发工具。既可以发挥多方的积极性,又可以形成统一的合力,较好兼顾了个性和共性。但这种平台式的组织模式对平台本身的建设提出了极高的要求,平台本身要求能够提供统一架构、统一认证、统一调用,并且实现自动化工具的敏捷和快速迭代。

平台式的组织模式对技术平台的基础功能和核心框架要求之高,让很多企业望而却步,苦于难以找到合适的技术平台,自研开发又极不现实。往往一些拥有大量的DevOps工程师的大型互联网企业才采用这种组织方式。好消息是腾讯已经将自己的蓝鲸智云平台开放、开源出来,腾讯蓝鲸是一个非常强大的自动化运维Paas平台,有兴趣做自动化运维的朋友就快点去下载体验吧

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


http://chatgpt.dhexx.cn/article/rtcHmnxD.shtml

相关文章

部署自动化运维工具rundeck

简单介绍: RunDeck 是用 Java/Grails 写的开源工具,帮助用户在数据中心或者云环境中自动化各种操作和流程。通过命令行或者 web 界面,用户可以对任意数量的服务器进行操作,大大降低了对服务器自动化的门槛。 官网地址&#xff1a…

python自动化运维学习

1.python能做什么? 2.解释型与编译型语言的区别? 3.动态型与静态型语言的区别? 4.ASCLL Unicode GBK UTF-8之间的联系 ASCLL码是最初被创建出来表示字符的,总共255个。每个占1字节---》字符不够用---》单独的中文编码GBK&#xff…

一站式自动化运维及自动化部署平台

真正的大师,永远都怀着一颗学徒的心! 一、项目简介 一站式自动化运维及自动化部署平台 二、实现功能 支持机器管理(环境变量、机器秘钥、终端日志、终端会话、机器代理) 支持调度任务 支持执行管理 支持应用管理 支持构建发布 支持用户…

IT运维之自动化运维

大家好,我是技福的小咖老师。 今天咱们来简单讲讲自动化运维的话题。 现在随着IT运维管理工作的复杂度和难度的大大增加,过去仅靠几个专门的运维人员或是“技术大拿”来包打天下已经行不通了,企业开始需要运用专业化、标准化和流程化的手段来…

自动化运维与普通运维有什么区别?

本文首发于知乎,由嘉为蓝鲸原创。 商业转载请联系作者获得授权,非商业转载请注明出处。 01. 何为自动化运维&普通运维? 在了解两者的区别前,我们得先明确对二者的定义,总的来说运维工作的目的都是为了保障企业业…

自动化运维平台Spug介绍

一、概要 Spug是一款使用PythonFlaskVueElement组件开发的开源运维管理系统,系统前后端分离,项目创建于2017年,2018 年 2 月第一个开源运维平台版本发布,设计为面向中小型企业设计的轻量级无Agent的自动化运维平台,UI基于Ant Desi…

Django 实现自动化运维后台

layui 框架与BootCSS框架相似都属于前端美化框架,区别在于BootCSS更加专业,而LayUI则更多的是面向于后端开发者,所以在组织形式上毅然采用了几年前的以浏览器为宿主的类 AMD 模块管理方式,却又并非受限于 CommonJS 的那些条条框框…

Linux自动化运维工具ansible详解

文章目录 认识ansibleansible的组成ansible的相关文件ansible的使用ansible的常用模块1、copy模块2、fetch模块3、command模块4、shell 模块5、file模块6、cron模块7、yum模块8、service模块9、script模块 认识ansible ansible是一个自动化运维工具的名称,集合了众…

如何实现网络自动化运维?

众所周知,网络是多个设备之间共享信息的连接。如今,手动管理连接到网络的每个设备会是一项重大的挑战,但是IT管理员可以通过网络自动化软件的功能的帮助来克服这一挑战,从而大大减少工作量和人为错误的可能。 网络编排是一种策略驱…

IT自动化运维平台建设解决方案

u当前IT运维的整体发展趋势是向自动化迭代,并向智能化演化; u目前大部分组织的IT运维正处在从人工运维向自动化运维的发展阶段; u有部分组织已经基本实现了自动化运维,正在向智能化运维升级,而也已有少量企业已经构建了…

Ansible 自动化运维

一、 Ansible:开源的运维自动化工具,可以提高运维工程师的效率,减少人为失误。操作简单,功能丰富。 特点:1)基于python开发,易于二次开发 2)丰富的内置模块,基本可以满足…

运维思索:自动化运维体系如何入手

需求 运维是事件驱动,还是自驱动可能是我们在运维工作中不太关注的问题。事件驱动让运维止步于故障,而自驱动让运维不止于建设。持续性的运维建设就需要一套自动化的运维体系,那么我们应该从何入手? 其实前期《运维思考》一系列…

自动化运维了解

背景 公司的服务器越来越多, 维护一些简单的事情都会变得很繁琐。用shell脚本来管理少量服务器效率还行, 服务器多了之后, shell脚本无法实现高效率运维。这种情况下,我们需要引入**自动化运维**工具, 对多台服务器实现高效运维。 需求 通过管理服务器能够按照需求灵…

做好自动化运维平台必备技能

万丈高楼平地起,高楼稳不稳取决于地基是否扎实。基础数据便是运维管理这座高楼的地基。 首先介绍一下我们在运维管理中所涉及到的基础数据有哪一些。请看下图: 基础数据大致分为CMDB、日志、生产DB、知识库四个模块。 一、基础数据概况 CMDB中文是配置管…

什么是自动化运维,目前的普及状况?

感觉随着近年全球运维大会的火热举办,自动化运维话题逐渐被推向了前所未有地热度,很多人都觉得这是炒作的概念,其实不然,它是随着信息技术发展的必然趋势,下面和大家细聊。 随着IT技术的发展,“大数据”、…

超全!常见自动化运维工具全解析(含ansible、Puppet、SaltStack教程)

在IT行业运维一直是重复性工作较多的重灾区,而通过自动化运维工具不仅可以让工作更加轻松还减少了人为失误。 实现自动化运维就是将复杂的事情简单化、标准化、流程化,通过工具重复性、周期性的实现。例如应用系统维护自动化,巡检自动化和故障…

优质的国外程序员网站

在学习计算机编程相关技术时,必须知道一些有用的网站,以便随时掌握信息,了解技术前沿和学习新技术。下面是整理的一些国外干货网站列表。由于大多在墙外,部分网站可能需要梯子,请自备。下面开始技术之旅吧。 索引 当你…

程序员自学网站推荐

1.CSDN(CSDN - 专业开发者社区) CSDN是国内非常知名的技术交流社区,创建的时间也比较早,所以在国内也很有影响力。并且CSDN还是有非常多很优质的原创文章与资料,对于程序员来讲经常来这边逛逛也会学到不少知识的。 2.Import New(import - J…

给大家推荐几个程序员必备网站

1、程序员导航CXY521: 程序员导航-CXY521http://www.cxy521.com/ 2、程序员盒子 coderutil 程序员盒子,专注于程序员学习编程提效 官网https://www.coderutil.com/ 3、程序员快速导航 程序员快速导航 - 专门为程序员服务的导航网站 (yundashi168.com)http://nav.yundashi1…

程序员平时上哪些网站

转载地址:http://blog.csdn.net/vqhgwjl9eub/article/details/78146795 前言 程序员每天必不可少的就是与电脑打交道,经常逛的一些网站也相对固定,今天小编给大家分享一下自己平时经常逛的一些网站,不管是开发,还是了解…