跳转到主要内容
内测功能:AI SRE 目前处于内测阶段,仅对受邀账户开放。如需参与白名单测试,请联系 Flashduty 商务团队申请开通;内测期间功能与界面可能调整。

概述


排障往往就发生在你的 IM 群里——告警推过来、大家在群里讨论、拉个作战室。AI SRE 把 Agent 直接放进这条协作链路:你不必切换到控制台,就能在 IM 里召唤它排查,团队成员也能全程看到它的分析过程。 AI SRE 的 IM 集成有两种触发方式:

@ 提及召唤

在群聊或私聊里 @ AI SRE 并描述问题,即可发起或续接一次排查。它在线程内回答,对话上下文与这条 IM 会话绑定。

作战室自动诊断

为故障开启 IM 作战室时,AI SRE 自动跑一轮初步诊断,并把结论作为一条分析消息回贴到作战室——无需任何人手动召唤。

支持的 IM 平台


AI SRE 的 IM 交互覆盖四个主流平台,每个平台都支持入站的 @ 提及(webhook)、历史消息读取与出站回复:
平台群聊 @ 提及私聊(DM)作战室自动诊断
Slack
飞书 / Lark
钉钉 / DingTalk
企业微信 / WeCom
IM 交互依赖你已在 Flashduty 中接入对应平台的机器人(用于告警通知与协作的同一套 IM 机器人)。请先在 Flashduty 的 IM 集成中完成机器人配置,AI SRE 才能在该平台收发消息。

@ 提及召唤


在已接入的 IM 群里 @ 机器人 并写下你的问题(例如「@AI SRE 看下 payment 服务为什么 5xx 飙升」),消息会通过平台 webhook 转给 AI SRE 处理:
1

识别提及

平台区分群聊 @ 提及私聊消息两种入口。被提及后,AI SRE 会做去重,并识别消息里是否带有命令式指令。
2

绑定会话

AI SRE 以「账户 + 平台 + 会话(chat)」为键定位一个会话:同一个 IM 会话里的多次 @ 提及,会续接到同一个 Agent 会话,从而保留上下文。若是新会话,平台会带入该 IM 线程的起始消息、以及(若有)关联的故障作为初始上下文。
3

读取上下文作答

AI SRE 读取线程 / 会话的历史消息构建上下文,自主排查,并把结论在线程内回复。消息里一并 @ 到的其他人也会被保留为提及对象,在回复中带上,方便多方在群里协作。
回复模式可配置(off / first / all),决定 AI SRE 是否在回复时 @ 提问者、以及是在线程内还是主频道作答。在嘈杂的大群里,线程内回复能让排查讨论保持聚拢、不刷屏。

作战室自动诊断


当你为一个故障在 IM 中开启作战室(war room)时,AI SRE 会自动介入——无需任何人 @ 它:
1

创建作战室

在故障的协作流程中创建作战室(飞书 / 钉钉 / 企业微信 / Slack 群)。
2

后台拉起诊断

作战室建好后,平台会以非阻塞后台任务触发一轮初步诊断,让 AI SRE 带着该故障的上下文进入排查。
3

回贴结论

诊断完成后,AI SRE 把分析结果作为一条消息发回作战室。人还没开始排查,第一手分析就已经摆在群里了。
作战室自动诊断与故障上下文绑定:进入排查时,对应的 incident_id 会绑定到本次运行,AI SRE 可据此读取故障详情、时间线与近期变更。关于故障 / 作战室与 A2A 的联动细节,见 Agent · 故障与作战室联动

与控制台会话的关系


无论从 IM 还是控制台发起,都是同一个 AI SRE:按顺序处理消息、流式输出、长对话自动压缩上下文、可绑定团队与运行环境。区别只在入口——
  • 控制台:在「对话」工作区里逐条提问、查看完整的工具调用与子会话面板。
  • IM:在你日常协作的群里 @ 召唤,结论回贴到线程;适合在故障现场快速拿到分析,再到控制台深入。
会话的更多细节见 对话

相关页面


概述

了解 AI SRE 的整体能力、典型场景与控制台导航。

控制台

了解会话、流式输出、取消与上下文压缩。

Agent

入站 Agent Card 与故障 / 作战室联动。

使用洞察

用 /insight 复盘近 30 天会话,发现运维摩擦。