内测功能:AI SRE 目前处于内测阶段,仅对受邀账户开放。如需参与白名单测试,请联系 Flashduty 商务团队申请开通;内测期间功能与界面可能调整。
概述
在任意 AI SRE 会话的输入框中输入
/insight,AI SRE 会回看您近 30 天的会话,产出一份单页的运营洞察报告。报告采用羊皮纸样式的 HTML,会作为聊天卡片直接渲染在会话中,您可以预览和下载。
这份报告回答三个问题:这一个月您用 AI SRE 做了多少事、主要在做什么、以及哪些重复出现的「摩擦」最值得现在就消除。所谓摩擦,是指那些一再消耗您时间的模式——比如同一个数据库连接串您在多个会话里反复粘贴、Agent 缺少某个本该已知的排查手册、或它反复查错了数据源。
/insight 是只读的。它只做分析和呈现,不会自动改动任何知识库、Skill 或 MCP 配置。每一条建议都是可复制的文本,是否采纳由您决定。详见 如何处理建议。/insight 是 AI SRE 内置的一项 Skill:它会自动导出你的历史会话、统计量化指标、逐段分析会话内容,最后汇总渲染成一份报告。整个过程对您透明,您只需要输入 /insight。
如何生成
分析范围
/insight 始终以账户为安全边界——它只会看到当前 app_key 有权读取的会话,绝不越界。在此前提下,具体范围由会话是否绑定团队决定:
| 会话状态 | 分析范围 | 说明 |
|---|---|---|
| 已绑定某个团队(如作战室 / 在 UI 中选定了团队) | 该团队 | 报告会聚焦这一个团队近 30 天的会话 |
| 未绑定团队 | 整个账户 | 分析您自己的会话,以及您所属团队的会话 |
报告是怎么来的
了解分析流程有助于您理解报告里的数字从何而来:导出会话并筛选
导出会话并筛选
AI SRE 先列出范围内近 30 天的会话(默认最多 200 个)并导出完整记录,再只保留多轮会话——即用户消息 ≥ 2 轮的会话;单轮会话没有可供学习的摩擦,会被排除在摩擦分析之外。
计算量化指标
计算量化指标
报告的第一层(量化总览)——会话数、您的轮数、工具调用数、平均轮数、按天的活跃度、工具与 Skill 分布、模型分布、结果分布——由程序在所有会话上确定性地统计得出,而非由模型估计,因此可靠且始终存在,即便没发现任何摩擦也照常呈现。
逐段分析并汇总
逐段分析并汇总
AI SRE 分段阅读会话记录,从每一段提炼出「会话主题」与「摩擦发现」,再把全部结果汇总:主题聚合成叙事概述,发现去重、聚类并按重要度排序成摩擦卡片。报告只包含提炼出的主题与发现,不会逐字搬运您的原始会话内容。
报告内容
报告自上而下分为三层,无论是否发现摩擦,第一层量化总览都会呈现。
第一层:量化总览
由程序确定性计算,而非模型估计;模型只负责把数字誊写进报告。包含:| 指标 | 说明 |
|---|---|
| 会话数 | 本次分析的会话数量(sessions) |
| 您的轮数 | 这些会话里您发出的消息总轮数(your turns) |
| 工具调用数 | Agent 发起的工具调用总数(tool calls) |
| 平均轮数 | 每个会话的平均轮数(avg turns / session,保留一位小数) |
| 活跃度 | 按天的会话活跃柱状图,标出起止日期 |
| 工具分布 | Agent 最常依赖的工具排行(取前 ~6 项) |
| Skill 分布 | 会话中调用过的 Skill 排行;若没有调用过任何 Skill,则显示「未调用任何 Skill」 |
| 模型分布 | 各模型各被多少个会话使用,形如 模型名(N 个会话) |
| 结果分布 | 完成 / 未完成 / 出错的会话数(某项为 0 时省略) |
第二层:叙事概述
用 2–4 句第二人称的话,概括您这一个月主要在做什么——最常处理的领域、反复出现的实体(被分析两次的同一个故障、反复出现的某个集群或主机),以及整月工作的大致形态。这部分由各会话提炼出的主题聚合而来。第三层:摩擦卡片
按重要度从高到低排序的摩擦卡片,最多约 8 张。每张卡片包含:- 排名与摩擦类型标签(五类之一,见下节);
- 一个频次徽标,表示这个摩擦在多少个不同会话里消耗过您(去重后的证据会话数);
- 一句话标题与一段第二人称的解释;
- 证据:所有命中此摩擦的真实会话 ID(全部列出,不截断);
- 可复制的建议:一段可直接粘贴的文本;
- 落点:这段文本应该写到
knowledge/<范围>/下的哪个文件。
每张摩擦卡片都必须引用至少一个真实会话 ID 作为证据——报告不会凭空捏造会话、事实或排查手册缺口。如果没有发现任何可排序的摩擦,第三层会显示一段空状态提示,而第一层和第二层照常呈现——此时「总览本身就是报告」。
摩擦类型
/insight 只识别五类摩擦,每一类都对应一个明确、可调整的「旋钮」。按默认重要度排序如下:
| 摩擦类型 | 在会话里的样子 | 建议落点 |
|---|---|---|
repeated_context(重复上下文) | 信号最强。 某个长期有效的事实,您在 ≥ 2 个不同会话里反复提供(数据库连接串、服务归属的团队、看板 URL、升级路径、集群名等) | 写进 DUTY.md / services.md,让它每次会话自动加载 |
missing_runbook(缺少运行手册) | Agent 不得不临时拼凑一套多步排查,而您显然期望它本就该会 | 新增运行手册:knowledge/<范围>/runbooks/<主题>.md |
wrong_data_source(数据源用错) | Agent 查了错误的数据源 / 集群 / 命名空间,被您纠正 | 在 observability.md / clusters.md 里固定正确的数据源 |
hallucinated_entity(臆测实体) | Agent 引用了一个并不存在的服务 / 主机 / 指标 / 变更,被您否定 | 把真实的实体清单补进 services.md |
stale_knowledge(知识过期) | 来自知识库 / DUTY.md 的某个事实已经过时或错误,被您当场纠正 | 更新那个过期的文件 |
如何处理建议
报告是只读的:它呈现问题、给出可复制的修复文本,但绝不自动应用任何改动。内测期间所有建议都是复制粘贴式的,需要您确认后,再到对应的资源里手动修改。
到对应资源里手动应用
根据摩擦类型,到相应的资源里粘贴并保存:重复上下文与臆测实体写进知识库的
services.md 或 DUTY.md;缺少运行手册则在知识库里新增一份 runbook;数据源用错就固定到 observability.md / clusters.md;知识过期则直接更新那个文件。这些都属于 知识库 的常规编辑。/insight 按需运行、一次一份——它不会「持续盯着」或定时生成报告。建议在又积累了几次故障排查之后再跑一次,看看哪些摩擦已被消除、又冒出了哪些新的。相关页面
控制台
了解会话的创建、团队绑定与作战室——这些决定了
/insight 的分析范围。管理知识
报告里的建议大多落在知识库的 DUTY.md /
services.md / runbooks,这里讲如何编辑。概述
从整体了解 AI SRE 的能力与运行机制。