了解新奇故障
title: "了解新奇故障"
description: "新奇故障识别,快速处理新故障"
date: "2024-10-22T14:00:00+08:00"
url: "https://docs.flashcat.cloud/zh/flashduty/past-incidents"
识别故障是常见的还是新奇的,加快故障处理。
所谓新奇故障,即在过去的一段时间内从未发生过的故障。如果一个故障被识别为新奇故障,那么故障响应者应该感到警惕。这对于 OnCall 工程师非常重要,因为新奇故障带来的影响可能是未知的,其处置步骤可能也需要临时决断。而有一些工程师,可能只关心那些新奇故障,他们会为解决此类故障制定标准化流程或者SOP。
:::tip
此功能当前为beta版本,且仅在专业版及以上订阅版本中提供,如果您需要开通此功能,请随时联系我们。
:::
查看新奇故障
控制台
- 在故障列表页面,新奇故障将提供明显的新奇标识;
- 在故障详情页面,新奇故障将在最上方提供明显的新奇标识和解释。
IM 工具
以飞书为例,当故障被识别为新奇告警时,系统会加强提醒:
如何识别
系统使用机器学习模型来判定故障之间的相似程度,当相似度大于90%时,我们认为两条故障之间是相似的。
我们在判断相似度时,主要考虑以下因素:
- 故障的标题
- 故障的详细描述
- 故障所影响的服务(一般提取自service标签)
- 故障中包含告警对象(一般提取自resource标签)
当系统检测到过去 30 天内都没有发生过相似故障,系统将故障标记为新奇故障。
常见问题
新奇故障是否需要单独开启?
无需设置和开启,默认所有专业版及以上订阅版本,系统都会触发新奇故障识别。最后修改时间: 1 个月前
查看新奇故障
控制台
IM 工具
如何识别
常见问题