运维思索:自动化运维体系如何入手

article/2025/9/28 7:06:55

需求

运维是事件驱动,还是自驱动可能是我们在运维工作中不太关注的问题。事件驱动让运维止步于故障,而自驱动让运维不止于建设。持续性的运维建设就需要一套自动化的运维体系,那么我们应该从何入手?

其实前期《运维思考》一系列文章已经给我们答案了,就是从运维框架入手分层建设、打好基础,记住“万丈高楼平地起,勿在浮沙筑高台”。

运维框架

在这里插入图片描述

通常讲到运维建设,我们脑海中首先浮现的是“一团麻”,因为这不是一个人、一个岗位的工作,而是一整个团队的工作;所以我们将“这团麻”进行由底层向上可划分为:

  • IT基础设施层

    IT基础设施层,主要由基础运维团队负责,主要包括存储、网络、服务器、安全设备等硬件设施;

  • 数据层

    数据层,主要由DBA团队、大数据团队负责,主要包括数据库、缓存、数仓等;

  • 应用层

    应用层,主要由应用运维团队负责,主要包括基础服务、业务应用、中间件等;

  • 管理层

    管理层,主要由配置管理团队、安全团队、应用运维团队负责,主要包括各种自动化操作、安全管理、监控管理等;

  • 展示层

    展示层,主要由各团队综合管理,主要包括各种管理工具、监控工具等;

通过对运维框架的分解,对各种资源的逻辑隔离,让各个团队明确当前运维建设中的现状与不足。 如果我们能做到对运维框架的持续性关注,通过图片就可以明晰的知道哪个团队的不足,以及日后各团队的重点发力方向。

运维依据

如果你觉得运维框架还不够细致,那么针对框架中各个层次的工作拆解就来了,我们在此将其称之为运维依据

针对这些个运维依据,我们可以展开一些列的针对性措施,如制定规范、自动化流程,如此就能够不断丰富各个团队的制度、规范、流程,何乐而不为?

在这里插入图片描述

1.基础设施层

在基础的硬件设施管理之上,比较重点的工作是

  • 网络分区与隔离

    网络分区应考虑互联网接入区、普通生产区、数据区、外联区等各个区域,保证各区域的合理接入。

    网络隔离对测试、准生产、生产环境各环境进行隔离,避免访问权限混乱。

  • CMDB资产纳管

    CMDB用于管理基础设施层的各项资产,为上层应用提供数据支撑。使用CMDB一定要和业务应用紧密结合,一旦脱离于业务使用,那么CMDB将成为花瓶。

    相关场景可参考《运维思索:接地气的运维自动化建设》。

  • 内部dns

    通过内部dns可以将应用与IP解耦,一旦ip变更则不需要变更代码,生产环境应该尽量少做此种类型变更操作。

  • 服务器快速上架

    为满足业务日益增长的需求,应该具备服务器快速上架、资产实时记录至CMDB等一系列自动化流程。

  • 网络权限变更

    根据应用需求,快速登记并开通网络权限。

等等。

2.数据库

数据库除了特有的集群外,可以考虑数据库工单、sql审核优化等流程。

3.系统应用

  • 容量规划

容量规划是指根据业务用户流量增长、现有容量等一定的基础数据之上进行周期性的评估,如果有条件的话可结合压测实际情况,这样数据会更准确。通过容量规划可有效控制服务器规范,避免资源溢出。

  • 环境维护与部署

为避免因环境差异导致的问题,各环境应用部署需要遵循统一的目录规范,统一的自动化部署方式,分离的应用配置文件。

等等

4.配置管理

  • 统一账号管理

    所有和用户登录相关的平台、管理工具,尽量接入ldap统一账号管理,这样一个账号可以实现所有系统的统一登录。

  • 自动化配置中心

    在此秉承基础设施即代码的思想,通过ansible作为配置中心,在操作系统层面实现系统初始化、环境初始化、组件初始化、自动化备份等中心化管理,各环境交付统一规格的服务器。

  • 流程管理

    结合jira等工作流工具实现操作的流程化管理。

等等

5.CI/CD

基于统一的运维规范前提下,CI/CD可以真正的做到将以上各个层面的想法、解决方案进行落地。因此CI/CD能力很大程度上决定了我们自动化运维的高度。

  • 持续集成

    代码质量测试、单元测试、打包测试、自动化测试等。

  • 操作系统交付

    遵循统一的运维规范,交付统一规格的操作系统,完成对运维平台各个管理节点的资源注册。

  • 版本发布

支持版本平滑发布、回滚、重启等。

  • 自动打包

    Android/IOS 自动打包并上传至应用商店。

6.监控系统

  • 系统建设

    多维度收集、分析监控数据,实现不同层面的告警;

    对于多维度的数据能够进行分析,实现故障自愈;

  • 监控管理

    监控并不是只要做到告警进行了,而是要做到告警的准确性,因此对告警级别、告警收敛、故障自愈策略等的管理需要我们进行重点关注。

7.安全防护

通过必要的WAF、IDS、防火墙等安全设备进行安全防护、流量分析外,还要结合安全渗透去主动发现问题。

8.数据分析

通过对应用数据、业务数据、运营数据进行集中分析、展示,帮助我们更好的了解系统运行状况。

总结

通过以上各个层面的运维框架和运维依据,希望大家能够结合实际情况进行头脑风暴,做到不止于此。

当然自动化运维建设不是一蹴而就的,需要结合规范、制度、流程去逐步实现。

记住运维建设是过程,不仅仅是目标,我们需要跟随技术潮流趋势,持续的优化与丰富这个过程。


http://chatgpt.dhexx.cn/article/o3xNwbhv.shtml

相关文章

自动化运维了解

背景 公司的服务器越来越多, 维护一些简单的事情都会变得很繁琐。用shell脚本来管理少量服务器效率还行, 服务器多了之后, shell脚本无法实现高效率运维。这种情况下,我们需要引入**自动化运维**工具, 对多台服务器实现高效运维。 需求 通过管理服务器能够按照需求灵…

做好自动化运维平台必备技能

万丈高楼平地起,高楼稳不稳取决于地基是否扎实。基础数据便是运维管理这座高楼的地基。 首先介绍一下我们在运维管理中所涉及到的基础数据有哪一些。请看下图: 基础数据大致分为CMDB、日志、生产DB、知识库四个模块。 一、基础数据概况 CMDB中文是配置管…

什么是自动化运维,目前的普及状况?

感觉随着近年全球运维大会的火热举办,自动化运维话题逐渐被推向了前所未有地热度,很多人都觉得这是炒作的概念,其实不然,它是随着信息技术发展的必然趋势,下面和大家细聊。 随着IT技术的发展,“大数据”、…

超全!常见自动化运维工具全解析(含ansible、Puppet、SaltStack教程)

在IT行业运维一直是重复性工作较多的重灾区,而通过自动化运维工具不仅可以让工作更加轻松还减少了人为失误。 实现自动化运维就是将复杂的事情简单化、标准化、流程化,通过工具重复性、周期性的实现。例如应用系统维护自动化,巡检自动化和故障…

优质的国外程序员网站

在学习计算机编程相关技术时,必须知道一些有用的网站,以便随时掌握信息,了解技术前沿和学习新技术。下面是整理的一些国外干货网站列表。由于大多在墙外,部分网站可能需要梯子,请自备。下面开始技术之旅吧。 索引 当你…

程序员自学网站推荐

1.CSDN(CSDN - 专业开发者社区) CSDN是国内非常知名的技术交流社区,创建的时间也比较早,所以在国内也很有影响力。并且CSDN还是有非常多很优质的原创文章与资料,对于程序员来讲经常来这边逛逛也会学到不少知识的。 2.Import New(import - J…

给大家推荐几个程序员必备网站

1、程序员导航CXY521: 程序员导航-CXY521http://www.cxy521.com/ 2、程序员盒子 coderutil 程序员盒子,专注于程序员学习编程提效 官网https://www.coderutil.com/ 3、程序员快速导航 程序员快速导航 - 专门为程序员服务的导航网站 (yundashi168.com)http://nav.yundashi1…

程序员平时上哪些网站

转载地址:http://blog.csdn.net/vqhgwjl9eub/article/details/78146795 前言 程序员每天必不可少的就是与电脑打交道,经常逛的一些网站也相对固定,今天小编给大家分享一下自己平时经常逛的一些网站,不管是开发,还是了解…

牛人程序员最爱逛的10大编程网站,你知道几个?

今天我给大家推荐10个高级程序员经常逛的网站,你又去过几个呢?来跟着小编一起看看都有哪些牛逼的网站吧。 分享之前我还是要推荐下我自己的前端学习群:653415492,不管你是小白还是大牛,小编我都挺欢迎,不定…

程序员必备网站,建议收藏!

俗话说的好,一个程序员,20%靠知识储备,80%靠网络搜索。 打开代码,打开Google,开始工作。 那么常用的写码软件,你知道几个呢? 下面我们来一起看一下常用的写码软件吧~ 建议收藏本文&#xff…

程序员必备网站

程序员学习网站: CSDNhttps://link.juejin.cn?targetwww.csdn.net 稀土掘金http://juejin.cn Giteehttps://link.juejin.cn?targetGitee.com Stack overflow中文网https://link.juejin.cn?targetstackoverflow.org.cn W3school在线教程https://link.juejin.cn?targetww…

10大程序员必逛网站,良心推荐,建议收藏!

本部分内容对应视频链接。 很多小伙伴在刚开始学习技术的时候,都会去找一些学习类的网站来提高自己的水平。但现在网络越来越发达,学习类的网站真的是多如牛毛。有的网站真的是非常优秀,可以让你学到不少技术,但同样也有很多网站…

8个不能错过的程序员必备网站,惊艳到我了!!!

程序员是一个需要不断学习的职业,不少朋友每天来逛CSDN、掘金等网站,但一直都抱着“收藏从未停止,学习从未开始”的态度,别骗自己了兄弟。在编程体系中,有很多不错的小工具,可以极大得提升我们的开发效率。…

程序员必备十大网站

窝窝整理了十大程序猿必备网站,涵盖了开源平台、搜索引擎、免费的精品课程,包括让你头疼的BUG、算法等。偷偷告诉你,还有帮你拿到心仪的 offer! 一,海量的资源平台 十大网站榜首 :GitHub — 开发者极其重…

10个程序员必上的网站

我的新书《Android App开发入门与实战》已于2020年8月由人民邮电出版社出版,欢迎购买。点击进入详情 文章目录 1.StackOverflow2.Quora3.Reddit4.StackExchange5.CodeProject6.Google Groups7.CodeRanch8.Programmers Heaven9.FindNerd10.Chegg 当我们写代码的时候&…

程序员必备的网站推荐

程序员必备的网站推荐 注:我收集的网站很有限,可能有很多网站没有列出,希望大家可以通过评论告知我,我会尽快添加。 一、资源导航网站 1.AI圈导航(https://www.puuuq.cn) 人工智能(AI)领域最全面的资源导…

推荐10个程序员常去的网站

偶尔有收到一些读者留言和询问:大佬,你知道有哪些适合初级学者的技术论坛或网站吗? 我摸了摸头,若有所思的答道:这个还真有,不知道你喜欢什么风格和适合哪些?.... 我没有见过凌晨4点的洛杉矶&…

程序员必备的 58 个网站,赶快收藏

程序员是一个需要不断学习的职业。幸运的是,在这个互联网时代,知识就在那里,等着我们去获取。 作为一个“收藏从未停止,学习从未开始”的博主,秉承着好东西不能独享的态度,把收藏的学习网站整理分享出来&am…

程序员必须收藏的网站整理(持续更新)

作为《程序员电脑必备软件整理(持续更新)》的姊妹篇,本文整理我认为有价值的网站链接,希望对你有所帮助 目录 1 论文相关 1.1 paperswithcode 1.2 paperweekly 1.3 sci-hub 1.4 快期刊 2 代码相关 2.1 DevDocs 2.2 sta…

【Qt学习】编写第一个Qt程序(使用纯代码)

其实大部分情况下还是使用qtcreator这个工具去编写我们的Qt程序,而为什么要记录下这一篇笔记呢?主要是想走一遍Qt编译的一个流程,更好的理解其内部的编译! 一、创建存放Qt程序的文件夹,以及Qt的main函数 mkdir test …