运维监控之——云原生运维监控报警架构(prometheus+grafana+netdata+Thanos+Alertmanager+Consul)

article/2025/6/25 10:41:49

成果展示:

一个项目单独拎出来:

 总体大屏:

​​​​​​​K8S大屏:

 Linux 主机大屏:

 

说明:

  1. 使用Prometheus(https://github.com/prometheus)原生的k8s服务发现驱动,采集容器化信息;通过微服务参数配置,暴露运行状态信息提供给prometheus,实现微服务信息采集;
  2. 通过新引入的netdata(https://github.com/netdata/netdata)做为采集器,采集除了微服务、k8s以外的所有资源信息;
  3. 通过consul解决新节点自动注册和发现问题;
  4. 使用prometheus时序数据库,解决存储效率问题;
  5. 通过thanos实现多个Prometheus实例构建集群模式;
  6. 使用alertmanager实现基础报警统一规则和触发。

后续可以考虑扩展:

  1. netdata+kafka,将采集数据写入其他引擎

2.2新架构技术特点

netdata特性:

1、效率高,资源开销低

2、可扩展性强,社区活跃,github 50k start

3、自带web界面,信息全,可替代dstat等linux工具

4、支持到秒级甚至实时监控

5、自带120+常用组件采集脚本,减轻工作负担

Prometheus特性:

1、基于时序数据库,存储效率高

2、支持集群模式,组合thanos扩展性强

3、云原生,容器化场景最热门方案

netdata+Prometheus对比zabbix架构

优点:

1、时效性从分钟级提高到秒级

2、存储、查询效率高

3、每个客户端提供一个漂亮的web界面、信息全,可大量减少登录服务器查询的次数

4、支持集群模式,扩展性强

5、直接支持一部分暴露jmx、metric信息的服务,减少监控脚本配置工作量

6、云计算、容器化场景更适合

7、数据持久化,原则支持无限长时间数据

8、支持降采样,极大提高长时间跨度查询效率

9、云原生项目,可容器化

缺点:

1、指标众多,需进行适当裁剪

2、自定义数据类型,有误差(最大误差0.0001%)

3、自定义采集脚本需要脚本开发能力(go、python),相比zabbix(shell)学习成本高

总结:

通过对比、了解业务各种报警监控采集方案,采用netdata + Prometheus + consul + thanos方案,效率更高、功能更强大、可扩展性强,较为符合云原生业务发展和需求。


http://chatgpt.dhexx.cn/article/LiN00nLo.shtml

相关文章

ARM机器使用netdata监控

ARM机器使用netdata监控 安装 下载地址 https://github.com/netdata/netdata/releases 找到对应平台的版本下载 此处使用了netdata-aarch64-latest.gz.run 下载下来直接sh netdata-aarch64-latest.gz.run 进行安装。 安装完成之后,可以通过在浏览器中访问htt…

非入侵式Linux 性能监控面板 NetData安装部署流程。

构建最佳的实时健康监控和性能故障排除解决方案: Netdata 是一款 Linux 性能实时监测工具.。以web的可视化方式展示系统及应用程序的实时运行状态(包括cpu、内存、硬盘输入/输出、网络等linux性能的数据)。 netdata官网:https:/…

openwrt - 性能监控 netdata

opkg open package management(opkg) 离线安装视频:https://www.youtube.com/watch?vEZtG8fmFewg 【笔记】openwrt - nginx配置反向代理(https下netdata不显示) https://lawsssscat.blog.csdn.net/article/details…

Netdata监控安装(汉化)

文章目录 Netdata安装部署<内网>软体下载修改脚本部署安装集群配置监控配置启动环境降低CPU占用Docker数据缺失 本教程主要描述内网环境下netdata汉化版本的安装过程 Netdata安装部署<内网> 软体下载 1、Netdata主程序&#xff1a; https://github.com/firehol/n…

Openwrt 手动安装 netdata 插件

环境&#xff1a; 硬件&#xff1a; 星际宝盒 IPQ4019 固件版本&#xff1a; OpenWrt R21.11.11 / LuCI Master (git-21.329.83689-00cb491) 起因&#xff1a; 首先 Netdata是一款开源的 、轻量的、跨平台的秒级数据收集与可视化呈现的Linux服务器性能监测工具&#xff0c;与Za…

Netdata 是一款 Linux 性能实时监测工具,以web的可视化方式展示

Netdata 是一款 Linux 性能实时监测工具.。以web的可视化方式展示系统及应用程序的实时运行状态&#xff08;包括cpu、内存、硬盘输入/输出、网络等linux性能的数据&#xff09;。 Netdata文档地址&#xff1a;https://github.com/firehol/netdata/wiki https://github.com/n…

Netdata安装以及汉化

Linux下netdata中文版安装以及汉化 Netdata 是一款 Linux 性能实时监测工具.。以web的可视化方式展示系统及应用程序的实时运行状态&#xff08;包括cpu、内存、硬盘输入/输出、网络等linux性能的数据&#xff09;。炫酷的界面来显示你的服务器性能。还能显示Nginx &#xff0…

linux性能监控工具Netdata安装和卸载教程

Netdata介绍 Netdata是一款Linux系统性能实时监控工具。是一个高度优化的Linux守护进程&#xff0c;可以对Linux系统、应用程序(包括但不限于Web服务器&#xff0c;数据库等)、SNMP服务等提供实时的性能监控。 Netdata用可视化的手段&#xff0c;将其被监控的信息展现出来&am…

Linux服务器监控的神器:Netdata

请访问我的独立博客查看文章&#xff1a; http://blog.ywheel.com/post/2017/03/26/netdata/ 由于工作的关系&#xff0c;最近在思考如何做集群、服务器的监控。在网上东转转西转转&#xff0c;偶然发现了一个单机监控的2016新秀Netdata&#xff0c;眼前着实为之一亮。 令人印象…

NetData 入门

NetData 入门 Y_Wolf&#xff08;2020.05.06&#xff09; 文章目录 NetData 入门一、项目环境二、NetData简介三、NetData安装方法一方法二 四、NetData的基本操作五、卸载NetData五、NetData的相关配置文件六、添加第三方扩展插件&#xff08;NVIDIA-SMI&#xff09;在这里插入…

netdata

导航 (返回顶部) 1. 概述2. 初级使用 2.1 使用截图2.2 仪表板帮助(滑鼠介面) 3. 扩展使用 3.1 查看当前配置3.2 启用远程访问3.3 也可运作在其他Web服务器(代理)上3.4 Netdata默认情况下通过Google Analytics&#xff08;分析&#xff09;收集匿名使用信息。3.5 繁体汉化补丁: …

Netdata,Linux性能实时监测工具

一&#xff0c;什么是Netdata Netdata是一个高度优化的Linux守护进程&#xff0c;它为Linux系统&#xff0c;应用程序&#xff0c;SNMP服务等提供实时的性能监测。 它用可视化的手段&#xff0c;将被监测者最细微的细节&#xff0c;展现了出来。这样&#xff0c;你便可以清晰…

Linux服务器监控的神器:Netdata(小白教程)快速搭建

发现了一个单机监控的Netdata&#xff0c;眼前着实为之一亮。 令人印象非常之深刻的个主要特性&#xff1a; 界面酷炫&#xff0c;实时监控零配置&#xff0c;即装即用 官网地址在这里&#xff1a; https://my-netdata.io/ Netdata的特点 netdata的主要功能&#xff0c;主要…

Netdata的百科全书

Netdata是系统和应用程序的分布式&#xff0c;实时&#xff0c;性能和健康监控。它是您在所有系统和容器上安装的高度优化的监视代理程序。 Netdata 使用高度交互的Web仪表板&#xff0c;实时提供其运行的系统&#xff08;包括Web服务器&#xff0c;数据库&#xff0c;应用程序…

【Netdata】性能监测工具介绍、安装、使用

一、工具介绍 Netdata是一款Linux系统实时性能监测工具&#xff0c;以web的可视化方式展示系统及应用程序的实时运行状态。前端响应快&#xff0c;UI很整洁&#xff0c;操作方面&#xff0c;支持图表重置&#xff0c;缩放。具体优点如下&#xff1a;界面酷炫&#xff1a;intera…

第一次面试

四月九号终于迎来了我的第一次面试&#xff0c;华为勇敢星实习面试。 投的软件测试工程师&#xff0c;华为有三道编程题AC一道就可以参加面试了。好久都没编程了&#xff0c;刷了半个月的题&#xff0c;心想最起码要AC一道&#xff0c;结果。。。就真只AC了一道。但是好歹进了面…

一路同行:开发者与华为云的2022

2022进入倒计时&#xff0c;年度回顾与展望总是必不可少的。对于科技创作者来说&#xff0c;我们最熟悉的群体就是开发者。这一年我们也参加了不少开发者活动&#xff0c;与大量开发者交流&#xff0c;并报道了很多开发者案例。 要形容这一年&#xff0c;茨威格的“人类群星闪耀…

华为——测开

一面 1、自我介绍 2、TCP UDP的区别 &#xff08;1&#xff09; TCP面向连接&#xff08;如打电话要先拨号建立连接&#xff09;;UDP是无连接的&#xff0c;即发送数据之前不需要建立连接 &#xff08;2&#xff09; TCP提供可靠的服务、也就是说&#xff0c;通过TCP连接传输的…

华为2018勇敢星实习软件类笔试(3题)4.10版

1.字符串重排 如图 主要思路是将数字、字母出现的数量用数组f进行记录&#xff0c;按序输出就行。 #include<iostream> #include<string> using namespace std;int main() {char a[1000];int n0;cin.getline(a,1000);while(a[n]!\0){}n--;int f[62]{0};for (int …

华为2018届校招勇敢星实习生招聘笔试+面试经历

写在前面 之前一直在忙期末&#xff0c;最近才歇了下来&#xff0c;来总结一下之前参加华为2018届勇敢星实习生笔试面试(研发类)并顺利拿到offer的经历。 我是在微信上投的Android研发实习生岗&#xff0c;很快就收到通知&#xff0c;于3.24晚上参加的在线笔试。今年华为的实习…