Dynatrace系列之- 如何发现和分析问题

article/2025/10/2 13:08:23

Dynatrace系列之- 如何发现和分析问题

Dynatrace用Problem(问题)表示异常情况,即偏离了正常行为或状态。例如某个服务速度变慢或某个用户登录应用速度变慢。每当检测到问题时,Dynatrace都会引发一个特定的problem event(问题事件)来表示此类异常。

请注意,您环境中新检测到的异常事件并不一定会立即引发一个新的问题(Problem)。Dynatrace抛出的问题(Problem)通常带有根本原因分析。为了确定问题的根本原因,Dynatrace采用了一种上下文感知的方法来检测一系列相互依赖的事件。Dynatrace会去分析相应时间段内涉及到的所有主机,所有进程,所有服务,所有应用程序以及他们之间纵向横向的依赖关系。只有通过这种上下文感知的方法,才最可能查明问题发生的真正根本原因。

问题检测

为了确定在什么时间点产生新problem event(问题事件)更合理,Dynatrace 会根据定义的阈值连续不停地评估传入的数据。通过这种方法来保证生成准确的响应时间退化和错误率上升的新problem event(问题事件)。对于应用和服务来说,急速的响应时间退化是根据5分钟时间段来评估的,慢速的响应时间退化是根据15分钟时间段来评估。

理解阈值

Dynatrace使用两种类型的阈值:

自动基线:

多维度基线自动检测随时间变化的各个参考值。自动基线参考值用于应对应用程序或服务“响应时间”,“错误率”和“交易量”中的动态变化。

内置静态阈值:

Dynatrace对所有基础架构相关的事件使用内置静态阈值(例如,检测CPU占用过多,磁盘空间不足或内存不足)。【注:此处最新版本中将会有改变,基础架构相关的事件将可以采用自动基线机制】

基于自动基线触发事件的机制与基于静态阈值完全不同。静态阈值提供了一种简单明了的方法,不需要学习时间就可以立即工作。但是,由于以下缺点,这种方法是不明智的:

  • 缺点1:为每种服务或用户操作设置静态阈值需要大量的人工。
  • 缺点2:为动态服务设置静态阈值可能具有挑战性。
  • 缺点3:无法适应不断变化的环境。
    因此,Dynatrace使用AI来开发一种智能的,自动化的多维基线方法。与静态阈值相反,此方法无需使用手动配置阈值即可立即使用,最重要的是,可自动适应流量模式的变化。

请注意,Dynatrace允许您通过调整静态阈值或偏离自动基线值来调整问题检测的敏感性。

问题分析

检测到问题后,您可以在问题的概述页面上直接分析其后果。Dynatrace提供了直接影响分析和业务影响分析的功能。另外,在问题的概述页面上,您可以分析问题的根本原因。

根本原因分析

为了确定问题的根本原因,Dynatrace不仅依赖于时间相关性,还遵循上下文感知的方法来检测跨时间,进程,主机,服务,应用程序以及在垂直和水平拓扑监控视角中相互依赖的事件。

下面是一个问题(Problem)的示意图,该问题的根本原因是基础结构层中的性能事件。
在这里插入图片描述

  1. Dynatrace检测到基础结构级别的性能事件。将创建一个新问题以进行跟踪,并通过Dynatrace移动应用程序发送通知。

  2. 几分钟后,基础结构问题导致应用程序服务之一出现性能下降问题。

  3. 其他服务级别的性能下降问题开始出现。因此,最初从一个孤立的仅基础架构的问题开始,已经发展成为一系列服务级别的问题,每个问题的根本原因都在于基础结构层的原始事件。

  4. 最终,服务级别的问题开始影响通过桌面或移动浏览器与您的应用程序进行交互的客户的用户体验。在问题生命周期的这一个时间点上,您遇到了一个应用程序问题,其中一个根本原因在基础架构层,而另一个根本原因在服务层。

因为Dynatrace可以了解您环境中的所有依赖关系,所以可以将客户遇到的性能下降问题与基础结构层中的原始性能问题相关联,从而有助于快速解决问题。

问题告警

在检测到异常后,Dynatrace可以生成告警,以通知负责人员出现的问题。Dynatrace允许您根据严重性,客户影响,关联的标签或检测到的问题的持续时间来设置细粒度的警报过滤规则。这些规则实际上使您可以定义警报配置文件。通过警报配置文件,您还可以与第三方消息系统(如Slack,HipChat和PagerDuty)建立过滤后的问题通知集成。


http://chatgpt.dhexx.cn/article/Y5fj4474.shtml

相关文章

网址和URL之间的区别:什么是RUI、RUL、URN

调用Web地址是普通的一个问题。一般这种情况,大家都会说,将“URL”放到浏览器中。这里提到的URL ,其实不是一个URL ,是网址的意思。URI 是统一资源标识符,而 URL 是统一资源定位符。因此,笼统地说&#xff…

146. LRU 缓存机制

LRU 缓存机制 运用你所掌握的数据结构,设计和实现一个 LRU (最近最少使用) 缓存机制 。 实现 LRUCache 类: LRUCache(int capacity) 以正整数作为容量 capacity 初始化 LRU 缓存int get(int key) 如果关键字 key 存在于缓存中,则返回关键字…

物理读之LRU(最近最少被使用)的深入解析 (解释LRU_FLAG的含义)

物理读之LRU(最近最少被使用)的深入解析 转载请注明出处: http://blog.csdn.net/guoyjoe/article/details/38264883 一组LRU链表包括LRU主链,LRU辅助链,LRUW主链,LRUW辅助链,称为一个WorkSet(…

LRU(最近最少使用)缓存机制

title: LRU缓存机制 categories: 操作系统 tags: 操作系统LRUOS计算机知识 LRU(最近最少使用)缓存机制 LRU:最近最少使用缓存机制 其设计的原则依据:如果一个数据在最近一段时间没有被访问到,那么在将来它被访问的可能性也很小。也就是…

LRU简单实现-了解一下?

LRU 算法 LRU 是一种作为缓存的算法,像 CPU 缓存,数据库缓存,浏览器缓存。以及在移动端开发时的图片安缓存,采用 LRU 缓存策略的应用很广泛。在面试中也是常常考察的一个点。当然也有其他缓存方法,常见的策略有三种&a…

LRU总结

文章目录 [146. LRU 缓存机制](https://leetcode-cn.com/problems/lru-cache/)ACM模式LRU 在 MySQL 中的应用LRU 在 Redis 中的应用面试官:来,手写一个线程安全并且可以设置过期时间的LRU缓存 146. LRU 缓存机制 力扣原题 class Node{public int key;pu…

html ur是什么意思_url是什么意思?

实际上,我们在使用互联网的过程中,其中有许多东西都是只会用,而不知道它到底是啥名字,看见了也不理解它是做什么的,比如今天我将和大家说的URL,实际上就是我们在互联网生活中非常常见的一个东西。 web前端学习:打造全网web前端全栈资料库(总目录)看完学的更快,掌握的…

LRU 缓存(Java)

请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。 实现 LRUCache 类: LRUCache(int capacity) 以 正整数 作为容量 capacity 初始化 LRU 缓存 int get(int key) 如果关键字 key 存在于缓存中,则返回关键字的值,否则返回 -1…

LRU算法的理解,终于懂了

https://blog.csdn.net/luoweifu/article/details/8297084 以上是让我看明白的博客链接。 下面是我自己的理解,比如下面这道题: 可以这么来看,有一个容量为6的容器,每次放进去一个有编号的球,如果容器中有相同编号…

LRU缓存

一、什么是LRU算法 LRU,Least Recently Used算法,即一种缓存淘汰策略。 计算机的缓存容量有限,若缓存满了则需要删除一些内容,给新的缓存腾出空间,但问题是要删除哪些内容呢?当然是把用的少的缓存删掉&am…

【网络】HTTP 协议中 URI 和 URL 有什么区别?

HTTP定义 超文本传输协议(Hyper Text Transfer Protocol,HTTP)是一个简单的请求-响应协议,它通常运行在TCP之上。它指定了客户端可能发送给服务器什么样的消息以及得到什么样的响应。请求和响应消息的头以ASCII形式给出 HTTP是用…

LRU缓存机制,你想知道的这里都有

概述 LRU是Least Recently Used的缩写,译为最近最少使用。它的理论基础为 “最近使用的数据会在未来一段时期内仍然被使用,已经很久没有使用的数据大概率在未来很长一段时间仍然不会被使用” 由于该思想非常契合业务场景 ,并且可以解决很多实…

LRU简单实现-了解一下

LRU 算法 LRU 是一种作为缓存的算法,像 CPU 缓存,数据库缓存,浏览器缓存。以及在移动端开发时的图片安缓存,采用 LRU 缓存策略的应用很广泛。在面试中也是常常考察的一个点。当然也有其他缓存方法,常见的策略有三种&a…

数据分析:RFM模型

补充: RFM分析方法:如何对用户按价值分类 深入解读和应用RFM分析方法(模型) 深入解读RFM模型-实战应用干货 转载自: 接地气的陈老师|作者 接地气学堂|来源:https://mp.weixin.qq.com/s/00vJPb9xqx4NL5Y5cPDXsw 问他咋做数据分…

数据分析之RFM模型

一.均值 RFM模型算法 从csv文件中读取相应的数据 datapd.read_csv(./dataset.csv,encodingISO-8859-1)#读取2014年的客户信息 data_14data[data[Order-year]2014] data_142.获取相应的列 data_14 data_14[[CustomerID,OrderDate,Sales]] data_14 CustomerID为用户id OrderD…

【数据分析】基于RFM模型的线上零售中的客户细分(二):RFM模型实战

基于RFM模型的线上零售中的客户细分(二) 摘要:在上一篇博客《基于RFM模型的线上零售中的客户细分(一):客户细分》中,我们了解了什么是客户细分,这篇博客将会结合具体的商业实例介绍同…

数据分析 一文搞懂什么是RFM模型

数据分析 | 一文搞懂什么是RFM模型 想知道你在电商平台心里的地位吗?学会RFM分析法,你自然知道 大家好,我是翔宇!今天我们来了解做数据分析一定要会的分析方法之一----RFM分析法。 相信大家在前天的双十一一定也多多少少贡献了…

RFM模型原理详解与实操运用

RFM模型原理详解与实操运用 RFM模型原理介绍为什么要使用RFM模型RMF模型原理介绍RFM模型用户细分 RFM模型实例操作背景/数据介绍RFM模型异化构建代码实现 最近在 运营课程中学习了RFM模型,又正正好在 商务智能的课程中学习了使用K-Means聚类分析实现RFM的操作。 …

如何利用RFM分析模型进行数据分析?

RFM模型 RFM主要根据客户活跃程度和平台交易金额贡献所做的分类。 近度:用字母R表示,代表客户最近一次的活跃距离目前的天数。在这部分客户中,有些优质客户值得通过一定的营销手段进行激活。 频度:用字母F表示,代表…

对RFM模型的理解

客户价值可以衡量客户对企业的相对重要性,是企业进行差异化决策的重要标准。 由此,通过客户价值分类可以为企业进行差异化营销策略奠定基础。 RFM模型对客户价值分类时非常简单的一种模型 以下从几大模块说一下个人对RFM模型的理解。 1.RFM模型是什么 …