Dynatrace系列之- 标记常见问题

article/2025/10/2 9:16:39

Dynatrace系列之- 标记常见问题

在大型环境中,系统的某些方面可能会持续触发不必要的警报。这些告警可能来自非关键组件或者是非关键情况下的资源不足的问题。通常这些问题不需要人员响应。

为了减少此类警报并避免发出垃圾告警邮件,Dynatrace AI根因分析引擎会自动检测那些经常发生但是并非重要的问题。Dynatrace通过观察指定期内(一天和一周)那些受监控实体的问题模型来检测此类频繁出现的问题。

当在这些时间段内多次检测到同一问题时,Dynatrace会根据阈值突破的实际严重程度与问题的持续时间来评估问题。然后,它会比较同一实体上过去的问题警报的严重性和持续时间,并且仅在问题的严重性增加时才发出警报。下图说明了此过程。
在这里插入图片描述
与之前的警报相比不太严重且持续时间较短的问题被认为是常见问题,因此针对这些问题取消了告警(Problem)。Dynatrace中事件严重性的排列如下:

事件严重级别事件类型
Severity 1Availability
Severity 2Error
Severity 3Slowdown
Severity 4Resource
Severity 5Custom
Severity 6Info(不生成Problem)

这种智能的检测和处理常见问题的方法可确保您收到严重性随时间而增加的问题的警报,同时避免警报垃圾邮件。
常见问题的概述页面包括“常见问题”消息,如下例所示。
在这里插入图片描述

常见问题评估

下图显示了问题的分类。

  • 绿色为正常运行状态。
  • 黄色是经常发生的事件,但对您的系统来说是正常的。例如,它可能是与非关键任务设备相关的慢磁盘读写事件。这些事件是不健康的,但没有必要告警。
  • 红色是确实会影响正常操作并触发警报的事件。
    在这里插入图片描述

评估过程的目标是将传入事件分类为黄色或红色。
对于每种事件类型和每个受监控实体,评估过程都是独立的。它从两组历史事件开始:

  • 最近24小时的事件
  • 最近7天的事件

然后进行如下评估:

  1. 将24小时数据集合以下面两种方式储存
  •  持续时间(最短到最长)
    
  •  严重程度(从低到高)
    
  1. 当一个新事件到达时,它将被放置在每个排序集中的适当位置。
  2. 从每个初始排序的集合中,创建一个子集,该子集由新事件右边的事件组成(即更长和更严重)。
  3. 创建一个参考集,其中包含同时出现在这两个子集中的事件。
  • 参考集的大小计算为参考集中的事件数。
    
  • 参考集的持续时间计算为参考集中事件的持续时间之和。
    
  1. 从7天的数据集合中创建相同的参考集。
  2. 评估以下条件:
  • 如果24小时参考集的大小等于或大于3,则将条件解析为黄色。否则,将其解析为红色。
    
  • 如果24小时参考集的持续时间等于或大于24小时的50%(12小时= 720分钟= 43,200秒),则该条件解析为黄色。否则,将其解析为红色。
    
  • 如果7天参考集的大小等于或大于7,则该条件解析为黄色。否则,将其解析为红色。
    
  • 如果7天参考集的持续时间等于或大于7天的30%(50.4小时= 3,024分钟= 181,440秒),则该条件解析为黄色。否则,将其解析为红色。
    
  1. 如果将至少一种情况解析为黄色,则事件分类为黄色。
    否则将其分类为红色,并触发警报。

初步评估后,每个黄色事件都将以1分钟的间隔重新评估,直到变为红色或停用为止。

有关评估过程请参见下面的示例。

为了简单起见,本示例仅考虑24小时制。在此示例中,事件类型是主机上的CPU饱和。最近24小时的历史事件具有以下持续时间和严重性:事件1 -45秒,95.5%
事件2 -15秒,99%
事件3 -35秒,98%
事件4 -30秒,97%
事件5 -60秒,96%排序后的集合如下所示:持续时间:{事件2,事件4,事件3,事件1,事件5 }
严重性:{事件1,事件5,事件4,事件3,事件2 }一个新的事件到来:事件NEW -28秒,95%。它在排序集中处于以下位置:持续时间:{事件2,事件NEW,事件4,事件3,事件1,事件5 }
严重性:{事件NEW,事件1,事件5,事件4,事件3,事件2 }包含右侧事件的子集如下所示:持续时间:{事件4,事件3,事件1,事件5 }
严重性:{事件1,事件5,事件4,事件3,事件2 }以下事件同时出现在两个子集中并形成参考集:{事件1,事件3,事件4,事件5 }。参考集的大小为4。条件被解析为黄色。
参考集的持续时间为170秒。条件被解析为红色。有一个黄色情况,因此“新事件”被分类为黄色,并且不会触发警报。

http://chatgpt.dhexx.cn/article/prb7Dr8s.shtml

相关文章

什么是 Dynatrace 里的 Visually Complete 度量标准

Dynatrace 中的 Visually Complete 是一个度量标准,用于测量在加载过程中用户在页面上看到的内容。Visually Complete 指标是当一个用户看到页面上的所有重要元素并且它们正确地渲染时所测量的时间点。这意味着所有可见的文本、图像和视频都已加载并正确显示。该指标…

DevSecOps 团队请避免陷入这些可观测性陷阱

如果您发现难以管理跨越多个云运行不断变化的容器化工作负载的庞大基础架构,那么您并不孤单。 根据 Dynatrace 近期发布的一项研究,超过一半的组织的 DevSecOps 团队在可观测性数据方面感到痛苦。 多云和混合计算设置的兴起,使大部分组织能够…

前端性能分析工具Dyna Trace使用心得(转)

什么是dynatrace ajax “dynatrace ajax 是一个详细的底层追踪工具,它不仅可以显示所有请求和文件在网络中传输的时间,还会记录浏览器render,CPU消耗、JS解析和运行情况等详细的信息,而这些也只是dynatrace ajax的冰山一角。” 为…

使用dynatrace+showslow进行前端性能测试

原文:http://blog.csdn.net/zhangren07/article/details/6883617 1.背景 应用的性能测试与优化目前主要停留在服务器端的反馈,而对于前端性能标准的研究与测试相对比较空白,缺乏统一的标准与工具。众所周知,浏览器html组件的下载…

什么是 Dynatrace 里的 User Action

用户操作是与最终用户界面的交互,涉及对 Web 服务器的调用,这可能有多个嵌套调用。 它是由用户输入(例如页面加载、单击或触摸)触发的从一个视图到另一个视图的转换。 Web 应用的 User Action 类型: Load actionsXHR …

Ultra Fast Deep Lane Detection with HybridAnchor Driven Ordinal Classification

Abstract 我们将车道检测过程视为一个使用全局特征的锚定驱动的有序分类问题。 首先,我们在一系列混合(行和列)锚点上用稀疏坐标表示车道。在锚驱动表示的帮助下,我们将车道检测任务重新表述为一个有序分类问题,以得到…

Dynatrace系列之-排除干扰请求

排除干扰请求 Dyatrace监控了所有服务端的请求。当特定请求的性能或者失败率高的时候,Dynatrace将触发告警。然尔不是所有的高并发的请求都是重要的请求,有些慢请求也不需要告警。比如心跳请求。这些不重要的请求可能会干扰整个服务(service)的响应时间…

Web Performance工具 – Dynatrace AJAX Edition

Dynatrace AJAX Edition是我认为最为强大的Web Performance Profile工具。废话不说了,直接上图介绍其主要功能。 先用IE访问你需要profile的网站,例如google,可以点击dynatrace工具栏来启动。这时候dynatrace就开始记录这个网站触发的一切事件。 我简单测试一下,点击googl…

DynamicArray

文章目录 1 DynamicArray设计要点2 继承关系图和接口实现3 代码实现4 代码优化 1 DynamicArray设计要点 类模板 动态确定内部数组空间的大小实现函数返回数组长度构造拷贝和赋值操作 2 继承关系图和接口实现 继承关系图 接口实现 template < typename T > class D…

云途加油站 | 一文读懂 Dynatrace 与 Amazon Lambda 的“双剑合璧心法”

Amazon Lambda 正在掀起企业级云市场的一场小潮流。不少业内人士发现&#xff0c;越来越多的企业正在将 Lambda 函数加入其技术栈中。 这一潮流其实不难理解—— 一则&#xff0c;门槛低。Amazon Lambda为企业进入云计算提供了相对较低的门槛&#xff0c;无需立即全面推行转移…

Dynatrace AppMon最佳实践(一)

经常有客户问我,如何利用Dynatrace捕获必要的应用性能监控信息,从而快速诊断性能问题?所谓捕获必要的信息,即是在应用出现性能下降的时候,PurePath能够捕获导致事务响应缓慢的方法,或是导致事务失败的异常栈信息,亦或是用户请求的上下文参数。如何通过Dynatrace捕获必要…

什么是 Dynatrace 的 Speed Index 度量标准

Dynatrace 中的 Speed Index 是一种度量网页加载速度的标准&#xff0c;它与 Visually Complete 类似&#xff0c;但更加精细。Speed Index 是一个计算值&#xff0c;反映了整个页面的加载速度&#xff0c;并将所有重要元素的渲染时间考虑在内。与 Visually Complete 不同的是&…

dynamic-datasource动态数据源学习

学习链接 spring整合mybatis的核心思路 & 数据源动态切换 & 多数据源事务控制 - 自己的链接&#xff08;本篇文章的上篇&#xff09; Mybatisplus生成代码配置 & p6spy打印sql & mybatis日志打印 & mybatisplus用法 dynamic-datasource-spring-boot-sta…

什么是 Dynatrace 的 Largest Contentful Paint

Dynatrace 多维分析使 Web 开发人员能够沿多个过滤维度分析浏览器监控执行情况。 多维分析页面以图表形式显示选定时间范围内的性能、可用性和错误计数。 可以选择较短的分析范围并以散点图和列表格式查看单个数据点。 页面顶部显示长期&#xff08;时间序列&#xff09;数据…

使用 Dynatrace 对 Node.js 应用的性能数据进行分析

JavaScript Storefront 应用程序的性能问题的表现形式有多种&#xff0c;最典型的是响应时间(response time)的恶化&#xff0c;甚至由于资源耗尽导致的网站完全宕机。 由于 JavaScript Storefront 涉及许多组件&#xff0c;因此确定性能问题的根源可能具有挑战性&#xff0c;如…

dynatrace 详解

dynaTrace Ajax&#xff1a;前端性能分析利器 谢 菊, 性能分析工程师, IBM 谢菊&#xff0c;IBM 中国软件开发中心&#xff08;CDL&#xff09;Lotus 部门的软件性能分析工程师&#xff0c;具有多个产品的性能测试经验&#xff0c;如IBM Portal Accelerator 和IBM Docs。目前正…

dynaTrace Ajax:前端性能分析利器

什么是 dynaTrace Ajax 随着 jQuery、Dojo、YUI 等框架的兴起让构建 Web2.0 应用更加容易&#xff0c;但随之带来的定位等应用问题也越来越难&#xff0c;尤其是与性能相关的。dynaTrace Ajax Edition 是一个强大的底层追踪、前端性能分析工具&#xff0c;该工具不仅能够记录浏…

监控方法基本套路

监控方法基本套路 性能测试监控方法基本套路 1、传统OS定位方法&#xff1a; 通过CPU&#xff0c;内存&#xff0c;IO&#xff0c;网络等指标初步确定问题根据问题进一步确定进程的PID根据进程PID&#xff0c;确定到线程基本TID根据线程的Dump确定堆栈信息根据堆栈信息定位到…

Dynatrace系列之- 如何发现和分析问题

Dynatrace系列之- 如何发现和分析问题 Dynatrace用Problem(问题)表示异常情况&#xff0c;即偏离了正常行为或状态。例如某个服务速度变慢或某个用户登录应用速度变慢。每当检测到问题时&#xff0c;Dynatrace都会引发一个特定的problem event(问题事件)来表示此类异常。 请注…

网址和URL之间的区别:什么是RUI、RUL、URN

调用Web地址是普通的一个问题。一般这种情况&#xff0c;大家都会说&#xff0c;将“URL”放到浏览器中。这里提到的URL &#xff0c;其实不是一个URL &#xff0c;是网址的意思。URI 是统一资源标识符&#xff0c;而 URL 是统一资源定位符。因此&#xff0c;笼统地说&#xff…