Flashduty Docs
中文EnglishRoadmapAPI官网控制台
中文EnglishRoadmapAPI官网控制台
  1. 故障管理
  • 快速开始
    • 入门介绍
    • 快速开始
    • 常见问题
    • 产品对比
  • 故障管理
    • 什么是故障
    • 检索与查看故障
    • 处理与更新故障
    • 升级与分派故障
    • 自定义字段
    • 自定义操作
    • 了解降噪过程
    • 了解历史故障
    • 了解新奇故障
  • 配置Flashduty
    • 协作空间管理
    • 多种方式接入告警
    • 配置路由规则
    • 配置标签增强
    • 配置告警降噪
    • 配置分派策略
    • 故障静默与抑制
    • 配置值班规则
    • 配置通知模板
    • 配置服务日历
    • 配置个人信息
    • 配置过滤条件
    • 通知机器人
    • 告警处理 pipeline
  • 平台功能
    • 团队和成员
    • 了解权限设计
    • 配置单点登录
    • 分析数据
  • 高级功能
    • 引用变量
    • 动态分派
  • 集成引导
    • 告警集成
      • 邮件 Email 集成指引
      • 夜莺 Flashcat 集成指引
      • Prometheus 集成指引
      • 标准告警事件集成指引
      • Grafana 集成指引
      • Zabbix 集成指引
      • Uptime Kuma 集成指引
      • 阿里云 ARMS 集成指引
      • 阿里云监控 CM 事件集成指引
      • 阿里云监控 CM 指标集成指引
      • 阿里云 SLS 集成指引
      • AWS CloudWatch 集成指引
      • Azure Monitor 集成指引
      • 百度云监控 BCM 集成指引
      • 华为云监控 CES 集成指引
      • 腾讯云 CLS 集成指引
      • 腾讯云监控 CM 集成指引
      • 腾讯云 Event Bridge 集成指引
      • Influxdata 集成指引
      • Open Falcon 集成指引
      • Pagerduty 集成指引
      • 蓝鲸智云集成指引
      • OceanBase 集成指引
      • Graylog 集成指引
      • Skywalking 集成指引
      • Sentry 集成指引
      • 监控宝告警集成指引
      • AWS EventBridge 集成指引
      • Dynatrace 集成指引
      • 华为云 LTS 集成指引
      • GoogleCloud 集成指引
      • Splunk 集成指引
      • AppDynamics 集成指引
      • SolarWinds 集成指引
      • 火山引擎CM 指标集成指引
      • 火山引擎CM 事件集成指引
      • 火山引擎日志服务 TLS 集成指引
      • Opmanager 告警事件
      • Meraki 告警事件
      • 天翼云告警集成
      • 观测云告警事件
      • zilliz 告警事件
      • 华为云 APM 告警事件
      • zstack 告警事件
      • Keep 告警集成指引
      • ElastAlert2 告警集成
    • 即时消息
      • 飞书 Lark 集成指引
      • 钉钉 Dingtalk 集成指引
      • 企业微信 Wecom 集成指引
      • Slack 集成指引
      • Microsoft Teams 集成指引
    • 单点登录
      • Authing 集成指引
      • Keycloak 集成指引
      • OpenLDAP 集成指引
    • Webhooks
      • 告警 webhook
      • 故障 webhook
      • 自定义操作
    • 变更集成
      • 标准变更事件集成指引
  • 服务协议
    • 服务条款
    • 用户协议/隐私政策
    • SLA承诺
    • 数据安全
  1. 故障管理

了解新奇故障

识别故障是常见的还是新奇的,加快故障处理。

所谓新奇故障,即在过去的一段时间内从未发生过的故障。如果一个故障被识别为新奇故障,那么故障响应者应该感到警惕。这对于 OnCall 工程师非常重要,因为新奇故障带来的影响可能是未知的,其处置步骤可能也需要临时决断。而有一些工程师,可能只关心那些新奇故障,他们会为解决此类故障制定标准化流程或者SOP。
提示
此功能当前为beta版本,且仅在专业版及以上订阅版本中提供,如果您需要开通此功能,请随时联系我们。

查看新奇故障#


控制台#

1.
在故障列表页面,新奇故障将提供明显的新奇标识;
2.
在故障详情页面,新奇故障将在最上方提供明显的新奇标识和解释。
新奇

IM 工具#

以飞书为例,当故障被识别为新奇告警时,系统会加强提醒:
新奇-feishu

如何识别#

系统使用机器学习模型来判定故障之间的相似程度,当相似度大于90%时,我们认为两条故障之间是相似的。
我们在判断相似度时,主要考虑以下因素:
1.
故障的标题
2.
故障的详细描述
3.
故障所影响的服务(一般提取自service标签)
4.
故障中包含告警对象(一般提取自resource标签)
当系统检测到过去 30 天内都没有发生过相似故障,系统将故障标记为新奇故障。

常见问题#


新奇故障是否需要单独开启?
无需设置和开启,默认所有专业版及以上订阅版本,系统都会触发新奇故障识别。
修改于 2024-11-15 09:04:06
上一页
了解历史故障
下一页
协作空间管理
Built with