Flashduty Docs
中文EnglishRoadmapAPI官网控制台
中文EnglishRoadmapAPI官网控制台
  1. 配置On-call
  • 简介
  • On-call
    • 快速开始
      • 快速开始
      • 常见问题
      • 产品对比
    • 故障管理
      • 什么是故障
      • 检索与查看故障
      • 处理与更新故障
      • 升级与分派故障
      • 自定义字段
      • 自定义操作
      • 了解降噪过程
      • 了解历史故障
      • 了解新奇故障
    • 配置On-call
      • 协作空间管理
      • 多种方式接入告警
      • 配置路由规则
      • 配置标签增强
      • 配置告警降噪
      • 配置分派策略
      • 故障静默与抑制
      • 配置值班规则
      • 配置通知模板
      • 配置服务日历
      • 配置个人信息
      • 配置过滤条件
      • 通知机器人
      • 告警处理 pipeline
    • 高级功能
      • 引用变量
      • 动态分派
      • 分析数据
    • 集成引导
      • 告警集成
        • 邮件 Email 集成指引
        • 夜莺 Flashcat 集成指引
        • Prometheus 集成指引
        • 标准告警事件集成指引
        • Grafana 集成指引
        • Zabbix 集成指引
        • Uptime Kuma 集成指引
        • 阿里云 ARMS 集成指引
        • 阿里云监控 CM 事件集成指引
        • 阿里云监控 CM 指标集成指引
        • 阿里云 SLS 集成指引
        • AWS CloudWatch 集成指引
        • Azure Monitor 集成指引
        • 百度云监控 BCM 集成指引
        • 华为云监控 CES 集成指引
        • 腾讯云 CLS 集成指引
        • 腾讯云监控 CM 集成指引
        • 腾讯云 Event Bridge 集成指引
        • Influxdata 集成指引
        • Open Falcon 集成指引
        • Pagerduty 集成指引
        • 蓝鲸智云集成指引
        • OceanBase 集成指引
        • Graylog 集成指引
        • Skywalking 集成指引
        • Sentry 集成指引
        • 监控宝告警集成指引
        • AWS EventBridge 集成指引
        • Dynatrace 集成指引
        • 华为云 LTS 集成指引
        • GoogleCloud 集成指引
        • Splunk 集成指引
        • AppDynamics 集成指引
        • SolarWinds 集成指引
        • 火山引擎CM 指标集成指引
        • 火山引擎CM 事件集成指引
        • 火山引擎日志服务 TLS 集成指引
        • Opmanager 告警事件
        • Meraki 告警事件
        • 天翼云告警集成
        • 观测云告警事件
        • zilliz 告警事件
        • 华为云 APM 告警事件
        • zstack 告警事件
        • Keep 告警集成指引
        • ElastAlert2 告警集成
      • 即时消息
        • 飞书 Lark 集成指引
        • 钉钉 Dingtalk 集成指引
        • 企业微信 Wecom 集成指引
        • Slack 集成指引
        • Microsoft Teams 集成指引
      • 单点登录
        • Authing 集成指引
        • Keycloak 集成指引
        • OpenLDAP 集成指引
      • Webhooks
        • 告警 webhook
        • 故障 webhook
        • 自定义操作
      • 变更集成
        • 标准变更事件集成指引
  • RUM
    • 快速开始
      • 入门介绍
      • 快速开始
      • 常见问题
    • 应用管理
      • 应用管理
      • SDK接入
      • 高级配置
      • 分析看板
    • 性能监控
      • 概览
      • 指标上报
      • 性能分析
      • 诊断优化
    • 异常追踪
      • 概览
      • 异常上报
      • 异常查看
      • 源码映射
      • 异常聚合
      • Issue状态
      • Issue告警
    • 其他
      • 术语说明
      • 数据收集
      • 数据安全
  • 平台功能
    • 团队和成员
    • 了解权限设计
    • 配置单点登录
  • 服务协议
    • 服务条款
    • 用户协议/隐私政策
    • SLA承诺
    • 数据安全
  1. 配置On-call

告警处理 pipeline

告警处理 Pipeline 用于对触发的告警事件进行管理和优化,包括更新告警标题、修改告警描述、调整告警严重程度、以及执行告警过滤或抑制等操作。通过合理配置告警处理规则,可以提升告警的可读性、减少告警噪声,并提升定位问题的效率。

告警接入流程#


告警处理配置#


配置路径:集成中心 => 集成详情 => 告警处理
在配置告警处理时,可以添加多个告警处理动作,FlashDuty 会按照配置的顺序依次执行告警处理动作。
在配置处理动作时,可以设置告警处理条件,当告警满足条件时,才会执行告警相应的处理动作。
每个处理动作的执行结果,都可以作为下一个处理动作的输入条件。

告警处理条件#


开启条件限制时,可以选择将符合条件的告警进行预处理,实现更精准、更灵活的告警处理动作。
告警处理条件支持多种选择,包括告警属性的标题、描述、严重程度,告警标签,值匹配模式支持模糊匹配、精确匹配、正则匹配、数值匹配、IP段匹配,具体参考配置过滤条件 文档内容。

告警处理类型#


更新告警标题#

将原告警标题修改为新的内容,新内容可以自行输入固定内容或者引用告警标签和属性以及组合的方式,引用语法可以参考引用语法文档内容,标题长度 不得超过 512 个字符,超出的将会截断处理。

更新告警描述#

将原告警描述修改为新的内容,新内容可以自行输入固定内容或者引用告警标签和属性以及组合的方式,引用语法可以参考 引用语法 文档内容,描述长度 不得超过 2048 个字符,超出的将会截断处理。

更新严重程度#

告警的严重程度通常依据系统预设的映射规则来确定的。现可以通过定制更新严重程度处理动作,调整告警的严重级别,从而更精准地定义告警的重要性。

告警丢弃#

告警丢弃和协作空间下的 排除规则 是相同的功能,唯一区别在于,前者是集成层面的丢弃,后者是协作空间层面的丢弃。告警丢弃处理动作在集成层面可以将不需要处理的告警直接丢弃掉,从而减少告警处理的压力。

告警抑制#

告警抑制提供了两种处理方式
集成层面的告警抑制是在告警进入系统的第一时间,将符合抑制条件的告警直接丢弃。
协作空间下的告警抑制是在通过路由规则进入到协作空间后将符合条件的告警抑制掉,此时,您可以灵活选择是丢弃这些告警,还是保留以备后续查看。
这种分层设计可以满足不同场景下的告警管理需求,既能减少不必要的告警噪声,又能确保关键告警得到有效处理。

使用场景和示例#


为了便于以下示例,我们将引用一个夜莺触发的测试告警,如下所示:
{
	"incident_status": "Info",
	"incident_severity": "Info",
	"title": "hm-test-告警规则名称 / Cluster-01 - demo-01",
	"description": "hm-test-告警规则名称 trigger value: 29.14912",
	"labels": {
		"__name__": "cpu_usage_idle",
		"cate": "prometheus",
		"check": "hm-test-告警规则名称",
		"cluster": "Cluster-01",
		"cpu": "cpu-total",
		"datasource_id": "4",
		"detail_url": "https://demo.flashcat.cloud/alert-his-events/4974655",
		"group_id": "1",
		"group_name": "FlashcatOps",
		"ident": "demo-01",
		"metric": "cpu_usage_idle",
		"prom_eval_interval": "10",
		"prom_ql": "cpu_usage_idle{ident=\"demo-01\"} \u003c 100",
		"region": "bj",
		"resource": "demo-01",
		"role": "master",
		"rule_id": "1041",
		"rule_prod": "metric",
		"trigger_value": "29.27852"
	}
}

场景一 :修改告警标题#

原告警标题在无法修改的情况下,默认使用的是:$check::$cluster::$ident,现可以通过更新告警标题处理动作重新定义告警标题,比如使用:Labels.ident、Labels.cpu:、Labels.trigger_value 或使用告警的其他属性作为告警标题,参考语法如下:
固定标题格式
自定义分隔符 + 内容组合
引用标签 + 引用告警属性

场景二:更新告警描述#

告警描述内容一般取的是告警规则名称加触发值,现可以通过更新告警描述处理动作,修改告警描述内容,参考语法如下:
自定义内容

场景三:更新告警严重程度#

默认情况下夜莺的三级告警对应 FlashDuty 的 Info 级别,现可以通过更新告警严重程度处理动作,调整告警的严重级别,从而更灵活定义告警的重要性。
将主机是 demo-01 的告警严重级别改为 Critical

添加官方技术支持微信

在这里,获得使用上的任何帮助,快速上手FlashDuty

微信扫码交流
上一页
通知机器人
下一页
引用变量
Built with