Flashduty Docs
中文EnglishRoadmapAPI官网控制台
中文EnglishRoadmapAPI官网控制台
  1. 故障管理
  • 简介
  • On-call
    • 快速开始
      • 快速开始
      • 常见问题
      • 产品对比
    • 故障管理
      • 什么是故障
      • 检索与查看故障
      • 处理与更新故障
      • 升级与分派故障
      • 自定义字段
      • 自定义操作
      • 了解降噪过程
      • 了解历史故障
      • 了解新奇故障
    • 配置On-call
      • 协作空间管理
      • 多种方式接入告警
      • 配置路由规则
      • 配置标签增强
      • 配置告警降噪
      • 配置分派策略
      • 故障静默与抑制
      • 配置值班规则
      • 配置通知模板
      • 配置服务日历
      • 配置个人信息
      • 配置过滤条件
      • 通知机器人
      • 告警处理 pipeline
    • 高级功能
      • 引用变量
      • 动态分派
      • 分析数据
    • 集成引导
      • 告警集成
        • 邮件 Email 集成指引
        • 夜莺 Flashcat 集成指引
        • Prometheus 集成指引
        • 标准告警事件集成指引
        • Grafana 集成指引
        • Zabbix 集成指引
        • Uptime Kuma 集成指引
        • 阿里云 ARMS 集成指引
        • 阿里云监控 CM 事件集成指引
        • 阿里云监控 CM 指标集成指引
        • 阿里云 SLS 集成指引
        • AWS CloudWatch 集成指引
        • Azure Monitor 集成指引
        • 百度云监控 BCM 集成指引
        • 华为云监控 CES 集成指引
        • 腾讯云 CLS 集成指引
        • 腾讯云监控 CM 集成指引
        • 腾讯云 Event Bridge 集成指引
        • Influxdata 集成指引
        • Open Falcon 集成指引
        • Pagerduty 集成指引
        • 蓝鲸智云集成指引
        • OceanBase 集成指引
        • Graylog 集成指引
        • Skywalking 集成指引
        • Sentry 集成指引
        • 监控宝告警集成指引
        • AWS EventBridge 集成指引
        • Dynatrace 集成指引
        • 华为云 LTS 集成指引
        • GoogleCloud 集成指引
        • Splunk 集成指引
        • AppDynamics 集成指引
        • SolarWinds 集成指引
        • 火山引擎CM 指标集成指引
        • 火山引擎CM 事件集成指引
        • 火山引擎日志服务 TLS 集成指引
        • Opmanager 告警事件
        • Meraki 告警事件
        • 天翼云告警集成
        • 观测云告警事件
        • zilliz 告警事件
        • 华为云 APM 告警事件
        • zstack 告警事件
        • Keep 告警集成指引
        • ElastAlert2 告警集成
      • 即时消息
        • 飞书 Lark 集成指引
        • 钉钉 Dingtalk 集成指引
        • 企业微信 Wecom 集成指引
        • Slack 集成指引
        • Microsoft Teams 集成指引
      • 单点登录
        • Authing 集成指引
        • Keycloak 集成指引
        • OpenLDAP 集成指引
      • Webhooks
        • 告警 webhook
        • 故障 webhook
        • 自定义操作
      • 变更集成
        • 标准变更事件集成指引
  • RUM
    • 快速开始
      • 入门介绍
      • 快速开始
      • 常见问题
    • 应用管理
      • 应用管理
      • SDK接入
      • 高级配置
      • 分析看板
    • 性能监控
      • 概览
      • 指标上报
      • 性能分析
      • 诊断优化
    • 异常追踪
      • 概览
      • 异常上报
      • 异常查看
      • 源码映射
      • 异常聚合
      • Issue状态
      • Issue告警
    • 其他
      • 术语说明
      • 数据收集
      • 数据安全
  • 平台功能
    • 团队和成员
    • 了解权限设计
    • 配置单点登录
  • 服务协议
    • 服务条款
    • 用户协议/隐私政策
    • SLA承诺
    • 数据安全
  1. 故障管理

了解历史故障

查阅历史相似故障解决办法,快速处理新故障。

在我们响应故障时,如果可以查看到历史上相似故障的解决方案,将极大加快故障解决效率。历史故障功能,正是为响应人员提供的一个已解决的相似的故障列表。对于不熟悉此问题的响应人员,可以快速查阅历史故障的时间线、根因和解决办法,并复制相关操作。历史故障提供了解决问题所需的上下文,也避免了响应人员遇到不熟悉问题时产生恐慌。
提示
此功能当前为beta版本,且仅在专业版及以上订阅版本中提供,如果您需要开通此功能,请随时联系我们。

查看相似故障#


控制台#

1.
从故障列表或协作空间,找到一条需要处理的故障;
2.
点击故障标题,进入故障详情,在详情中选择历史故障标签页。
Flashduty-历史告警.png
系统会至多给出5条相似的历史故障,以避免信息太多导致您查阅辨识浪费更多时间。

排序原则#

我们如何进行排序?
1.
系统仅匹配相似度大于90%的故障;
2.
系统优先返回设置了更详细解决办法和问题根因的故障;
3.
系统优先返回相似度更高的故障;
4.
系统优先返回最近发生的故障。
提示
每次解决故障时,留下 解决办法 与 问题根因 是一个好习惯,这会极大提升后来者响应故障的速度。

如何识别#

系统使用机器学习模型来判定故障之间的相似程度,当相似度大于90%时,我们认为两条故障之间是相似的。
我们在判断相似度时,主要考虑以下因素:
1.
故障的标题
2.
故障的详细描述
3.
故障所影响的服务(一般提取自service标签)
4.
故障中包含告警对象(一般提取自resource标签)
当检索历史故障时,系统仅匹配当前协作空间下的、已解决的相似故障。

常见问题#


我可以查看多久之前的历史故障?
目前只能查看当前故障发生时间前30天内的相似故障。随着时间推移,系统可能会删除历史数据,这种情况下,您可能无法查看到历史故障。
无论如何,对于当前正在发生的故障,您可以查阅至多30天的历史数据。
我是否可以标记当前故障与历史故障并不相似?
不可以,目前系统无标记功能。但您可以通过其他渠道与我们进行沟通和反馈。
我如何可以让历史故障产生更好的效果?
1.
建议您对于重要的故障,完善填写问题根因和解决办法;
2.
建议您尽量丰富故障的标签,尤其是service和resource标签;
3.
建议您丰富告警的标题和描述信息,更准确的表达故障现象。

添加官方技术支持微信

在这里,获得使用上的任何帮助,快速上手FlashDuty

微信扫码交流
上一页
了解降噪过程
下一页
了解新奇故障
Built with