为什么需要故障复盘
每次故障处理完,团队是不是长舒一口气就各忙各的了?
但如果不及时回顾和总结,同样的问题很可能会以不同的面貌再次出现。故障复盘(Post-Mortem)就是帮助团队在故障平息后冷静下来,系统性地回答三个问题:发生了什么、为什么发生、怎样避免再次发生。
Flashduty 将故障复盘融入了故障处理流程——从故障详情页一键创建复盘报告,AI 帮你打底稿,团队成员在线协作完善,最终形成一份可归档、可追溯的复盘报告。
一份复盘报告长什么样
一份典型的复盘报告包含以下内容:
- 关联故障:这份报告是针对哪个故障写的
- 基本信息:严重程度、故障时间范围、持续时长、响应人员
- 报告正文:按照模板章节组织的详细分析,通常包括综述、根因分析、影响范围、处理时间线、改进措施和经验教训
- 跟进事项:后续需要落实的改进行动
- 作者列表:所有参与编写的人员
报告状态
复盘报告有两种状态:
| 状态 | 含义 |
|---|
| 草稿 | 报告还在编写中,团队可以随时修改 |
| 已发布 | 报告已定稿,可供团队查阅和归档 |
状态可以随时来回切换。即使发布后发现需要补充内容,切回草稿修改后重新发布即可。
归属关系
创建复盘报告时,系统会自动从第一个关联故障中继承协作空间和团队归属,方便按团队维度管理和查看复盘报告。
Flashduty 复盘有什么不同
AI 帮你写初稿
不用对着空白页面发愁。点击生成复盘报告,系统会分析关联故障的告警数据、处理时间线、甚至作战室中的讨论记录,自动生成一份结构完整的报告初稿。你要做的只是在此基础上调整和补充。
像编辑在线文档一样协作
多位团队成员可以同时打开同一份报告进行编辑,彼此的修改实时可见,不会冲突。
用模板规范复盘流程
系统提供中英文内置模板,你也可以创建适合自己团队的自定义模板。统一的模板确保每次复盘都不会遗漏关键章节。
图文并茂
编辑器支持直接粘贴或拖拽图片,方便你在报告中插入监控截图、架构图或故障现场的关键信息。
一次完整的复盘流程
从故障创建报告
在故障详情页选择故障和模板,一键创建复盘报告。系统会自动提取故障的关键信息作为报告的基本数据。
编写报告
在在线编辑器中编写报告正文——可以让 AI 生成初稿,再由团队成员协作完善。同时可以修改标题、基本信息和跟进事项。
持续跟进
发布后如果需要补充内容或修正信息,随时可以切回草稿继续编辑。不再需要的报告也可以删除,系统会自动清理所有关联数据。