Flashduty Docs
中文EnglishRoadmapAPI官网控制台
中文EnglishRoadmapAPI官网控制台
  1. 告警集成
  • 简介
  • On-call
    • 快速开始
      • 快速开始
      • 常见问题
      • 产品对比
    • 故障管理
      • 什么是故障
      • 检索与查看故障
      • 处理与更新故障
      • 升级与分派故障
      • 自定义字段
      • 自定义操作
      • 了解降噪过程
      • 了解历史故障
      • 了解新奇故障
    • 配置On-call
      • 协作空间管理
      • 多种方式接入告警
      • 配置路由规则
      • 配置标签增强
      • 配置告警降噪
      • 配置分派策略
      • 故障静默与抑制
      • 配置值班规则
      • 配置通知模板
      • 配置服务日历
      • 配置个人信息
      • 配置过滤条件
      • 通知机器人
      • 告警处理 pipeline
    • 高级功能
      • 引用变量
      • 动态分派
      • 分析数据
    • 集成引导
      • 告警集成
        • 邮件 Email 集成指引
        • 夜莺 Flashcat 集成指引
        • Prometheus 集成指引
        • 标准告警事件集成指引
        • Grafana 集成指引
        • Zabbix 集成指引
        • Uptime Kuma 集成指引
        • 阿里云 ARMS 集成指引
        • 阿里云监控 CM 事件集成指引
        • 阿里云监控 CM 指标集成指引
        • 阿里云 SLS 集成指引
        • AWS CloudWatch 集成指引
        • Azure Monitor 集成指引
        • 百度云监控 BCM 集成指引
        • 华为云监控 CES 集成指引
        • 腾讯云 CLS 集成指引
        • 腾讯云监控 CM 集成指引
        • 腾讯云 Event Bridge 集成指引
        • Influxdata 集成指引
        • Open Falcon 集成指引
        • Pagerduty 集成指引
        • 蓝鲸智云集成指引
        • OceanBase 集成指引
        • Graylog 集成指引
        • Skywalking 集成指引
        • Sentry 集成指引
        • 监控宝告警集成指引
        • AWS EventBridge 集成指引
        • Dynatrace 集成指引
        • 华为云 LTS 集成指引
        • GoogleCloud 集成指引
        • Splunk 集成指引
        • AppDynamics 集成指引
        • SolarWinds 集成指引
        • 火山引擎CM 指标集成指引
        • 火山引擎CM 事件集成指引
        • 火山引擎日志服务 TLS 集成指引
        • Opmanager 告警事件
        • Meraki 告警事件
        • 天翼云告警集成
        • 观测云告警事件
        • zilliz 告警事件
        • 华为云 APM 告警事件
        • zstack 告警事件
        • Keep 告警集成指引
        • ElastAlert2 告警集成
      • 即时消息
        • 飞书 Lark 集成指引
        • 钉钉 Dingtalk 集成指引
        • 企业微信 Wecom 集成指引
        • Slack 集成指引
        • Microsoft Teams 集成指引
      • 单点登录
        • Authing 集成指引
        • Keycloak 集成指引
        • OpenLDAP 集成指引
      • Webhooks
        • 告警 webhook
        • 故障 webhook
        • 自定义操作
      • 变更集成
        • 标准变更事件集成指引
  • RUM
    • 快速开始
      • 入门介绍
      • 快速开始
      • 常见问题
    • 应用管理
      • 应用管理
      • SDK接入
      • 高级配置
      • 分析看板
    • 性能监控
      • 概览
      • 指标上报
      • 性能分析
      • 诊断优化
    • 异常追踪
      • 概览
      • 异常上报
      • 异常查看
      • 源码映射
      • 异常聚合
      • Issue状态
      • Issue告警
    • 其他
      • 术语说明
      • 数据收集
      • 数据安全
  • 平台功能
    • 团队和成员
    • 了解权限设计
    • 配置单点登录
  • 服务协议
    • 服务条款
    • 用户协议/隐私政策
    • SLA承诺
    • 数据安全
  1. 告警集成

Prometheus 集成指引

通过 webhook 的方式将 Prometheus 告警事件通过 AlertManager 推送到 Flashduty。当告警触发时,向 Flashduty 发送触发事件,当告警恢复时,向 Flashduty 发送恢复事件。

使用限制#


在 AlertManager#

您必须拥有修改 AlertManager 配置文件的权限。
您的 AlertManager server 必须能够访问域名 api.flascat.cloud,将告警推送到外网。

支持版本#


本文适配 Alertmanager 0.16.0 及以上 版本。

操作步骤#


在 Flashduty#

您可通过以下2种方式,获取一个集成推送地址,任选其一即可。

使用专属集成#

当您不需要将告警事件路由到不同的协作空间,优先选择此方式,更简单。
展开
1.
进入 Flashduty 控制台,选择 协作空间,进入某个空间的详情页面
2.
选择 集成数据 tab,点击 添加一个集成,进入添加集成页面
3.
选择 Prometheus 集成,点击 保存,生成卡片。
4.
点击生成的卡片,可以查看到 推送地址,复制备用,完成。

使用共享集成#

当您需要根据告警事件的 Payload 信息,将告警路由到不同的协作空间,优先选择此方式。
展开
1.
进入 Flashduty 控制台,选择 集成中心=>告警事件,进入集成选择页面。
2.
选择 ** Prometheus** 集成:
集成名称:为当前集成定义一个名称。
3.
配置默认路由,并选择对应的协作空间(集成创建后可以前往 路由 进行更多路由规则的配置)。
4.
点击 保存 后,复制当前页面的新生成的 推送地址 备用。
5.
完成。

在 AlertManager#

步骤 1:配置 Alertmanager#

1.
登录您的 Alertmanager 实例
2.
找到并打开配置文件,一般为 Alertmanager 部署根目录下的 alertmanager.yml
3.
在 receivers 配置部分,增加一个 Flashduty webhook 类型的 receiver,如下
receivers:
- name: 'flashcat'
  webhook_configs:
  - url: '<您的集成推送地址>'
    send_resolved: true
您需要替换 url 对应的参数值为集成的推送地址,注意 query string 参数部分需要携带 integration_key。
如果您需要通过代理请求 Flashduty,可以额外设置 http_config 的 proxy_url 参数为代理地址:
receivers:
- name: 'flashcat'
  webhook_configs:
  - url: '<您的集成推送地址>'
    send_resolved: true
    http_config:
    proxy_url: 'http://proxyserver:port'
4.
在 route 配置部分,更改默认 route 指定 receiver 为刚才配置的 webhook,如下:
route:
  receiver: 'flashcat'
如果希望不影响之前的推送渠道,您也可以把 receiver 添加到 route 的子路由中
route:
 receiver: 'feishu'
 - routes:
   receiver: 'flashcat'
5.
保存配置文件
6.
通过重新加载配置文件(向进程发送 SIGHUP 信号,或 POST 请求/-/reload api),使更改生效
7.
完成

步骤 2:配置 Timestamp#

默认情况下,系统使用当前时间作为事件触发时间。如果您希望自定义时间,您可以额外设定一个 timestamp 字段来标识每一次告警发生的准确时间。
1.
登录您的 Prometheus Server 实例
2.
打开告警规则相关配置文件
3.
对于每一条告警规则,更改 annotations 部分,添加 timestamp 字段,如下:
annotations:
  timestamp: '{{ with query "time()" }}{{ . | first | value }}{{ end }}'
  ...
4.
保存配置文件
5.
通过重新加载配置文件(向进程发送 SIGHUP 信号,或 POST 请求/-/reload api),使更改生效
6.
完成

严重程度映射关系#


系统依次提取告警事件标签中的 severity、priority和 level,对应值将作为 Prometheus 自身的告警等级,如果没有提取到,系统自动设置 Prometheus 告警等级为 Warning。
Promtheus 到 Flashduty 告警等级映射关系:
PrometheusFlashduty状态
criticalCritical严重
warningWarning警告
warnWarning警告
infoInfo提醒
acknowledgedInfo提醒
unknownInfo提醒
unkInfo提醒
okOk恢复

常见问题#


为什么在Flashduty没有收到告警?

在 Flashduty#

1.
查看集成是否展示了 最新事件时间?如果没有,代表Flashduty没有收到推送,直接优先排查 AlertManager 部分。
2.
如果您使用的是 共享集成,优先确认您是否配置了 路由规则。不设置路由规则,系统会直接拒绝新的推送,因为没有协作空间可以承接您的告警。这种情况下,直接配置路由规则到您期望的空间即可。

在 AlertManager#

1.
首先确认 AlertManager 测是否产生了新的告警。如没有产生新告警,请继续等待新告警触发后重新验证。
2.
打开 AlertManager 配置文件,如果您设置了子路由,请确保您的路由设置正确(比如前边的路由设置了 continue,AlertManager 会跳过匹配后续子路由。我们推荐您永远仅设置一个默认路由到 Flashduty)。同时验证,目标回调地址是否和集成推送地址完全匹配。如果不匹配,请修改 告警规则后重新验证。
3.
如果匹配,请继续确认 AlertManager 实例可以访问外网 api.flashcat.cloud 域名。如果不可以,您首先需要为其开通外网,或单独针对 Flashduty 的域名开通外网访问。
4.
如果网络无问题,您需要继续排查 AlertManager,查找是否存在相关的错误日志。
如果以上步骤执行之后,仍然没有查询到问题根因,请直接联系我们。

添加官方技术支持微信

在这里,获得使用上的任何帮助,快速上手FlashDuty

微信扫码交流
上一页
夜莺 Flashcat 集成指引
下一页
标准告警事件集成指引
Built with