适配场景#
告警责任人在源监控系统中维护且频繁调整,希望及时同步到 Flashduty。客户 A 自研大数据任务系统,内部人员可以在此平台新建各类数据批处理任务,每个任务可以设定第一责任人和第二责任人。当批处理任务处理失败时,系统会优先告警通知第一责任人,如果超过30分钟此告警还没有恢复,则升级为第二责任人。客户 B 使用 Zabbix 做主机监控,并且针对每一条主机设定了一个负责人 tag。客户希望改主机告警时,能够根据此 tag 通知到对应的责任人。客户 C 有一套自研监控系统,设定了很多告警策略,每一条策略都设定通知到某个微信群。该客户决定将事件响应迁移至 Flashduty,但希望仍然保留源监控系统中策略到微信群的关系,并且能够将告警依赖此关系动态通知到微信群。实现方式#
添加特定标签或 Query 参数,用于覆盖 Flashduty 中的分派对象,实现动态分派。参数名:需要满足正则:^layer_person_reset_(\d)_emails$,环节数字从0开始。eg.layer_person_reset_0_emails代表替换分派策略环节1的分派人员。
参数位置:Query 参数或标签值。eg.夜莺告警设定此标签,或通过标签增强等方式自动生成标签。
参数名:需要满足正则:^layer_person_reset_(\d)team_names$,环节数字从0开始。eg.layer_person_reset_0_team_names代表替换分派策略环节1的团队。
参数值:团队名称,多个团队使用“,”分割。eg.A组,B组,将团队替换为A组和B组。
参数位置:Query 参数或标签值。eg.夜莺告警设定此标签,或通过标签增强等方式自动生成标签。
参数名:需要满足正则:^layer_webhook_reset_(\d)_wecoms$,环节数字从0开始。eg.layer_webhook_reset_0_wecoms代表替换分派策略环节1的企微群聊机器人。
参数值:目标群聊机器人 token,多个 token 使用“,”分割。eg.bbb025a0-e2e8-4b79-939d-82c91a275b06,将群聊机器人替换成此token对应的机器人。
参数位置:Query 参数或标签值。eg.夜莺告警设定此标签,或通过标签增强等方式自动生成标签。
参数名:需要满足正则:^layer_webhook_reset_(\d)_dingtalks$,环节数字从0开始。eg.layer_webhook_reset_0_dingtalks代表替换分派策略环节1的钉钉群聊机器人。
参数值:目标群聊机器人 token,多个 token 使用“,”分割。eg.bbb025a0-e2e8-4b79-939d-82c91a275b06,将群聊机器人替换成此token对应的机器人。
参数位置:Query 参数或标签值。eg.夜莺告警设定此标签,或通过标签增强等方式自动生成标签。
参数名:需要满足正则:^layer_webhook_reset_(\d)_feishus$,环节数字从0开始。eg.layer_webhook_reset_0_feishus代表替换分派策略环节1的飞书群聊机器人。
参数值:目标群聊机器人 token,多个 token 使用“,”分割。eg.bbb025a0-e2e8-4b79-939d-82c91a275b06,将群聊机器人替换成此token对应的机器人。
参数位置:Query 参数或标签值。eg.夜莺告警设定此标签,或通过标签增强等方式自动生成标签。
故障触发时,Flashduty 按照已有的分派策略进行匹配。匹配到分派策略后,按照此策略中的环节进行分派或升级,如果设定上述参数,系统会自动替换分派对象或群聊通道。所匹配的分派策略中,除了分派对象和群聊目标发生变更,其他内容维持不变,相当于一个模板分派策略。
推送示例#
设置模板分派策略#
为协作空间配置一个分派策略。如下图所示,该空间只设定一个分派环节,分派对象为头铁科技,同时推送 token 为 5b96 结尾的企微群聊。为告警设定标签#
我们以自定义告警事件集成为例,向目标协作空间推送一条示例告警。设定了 layer_person_reset_0_emails 标签,期望将环节一的分派人员替换为 guoyuhang 和 yushuangyu。设定了 layer_webhook_reset_0_wecoms 标签,期望将环节一的微信群聊 token 替换为 d9c0 结尾的 token。查看故障分派时间线#
如下图所示,目标故障正常触发并进行分派。故障的分派人员和目标群聊都按照预期进行了替换。常见问题