AI 复盘报告
故障处理结束后,如何快速沉淀经验、避免重蹈覆辙?Flashduty 推出 AI 复盘报告,基于故障时间线和告警数据,自动生成结构化复盘文档:- 一键生成:AI 自动提炼故障概况、影响范围、根因分析和改进建议
- 协同编辑:支持多人在线编辑复盘报告,实时同步修改
- 权限管控:可设置复盘报告的访问权限,确保敏感信息安全
- 图片支持:支持在复盘报告中上传和插入图片
AI 助手
控制台内嵌全新 AI 助手,为您提供智能化的故障排查和运维辅助:- 即时问答:在控制台内直接与 AI 对话,快速获取故障排查建议
- Mermaid 图表渲染:AI 生成的流程图和架构图支持可视化展示,支持缩放与全屏查看
- 图片粘贴:支持从剪贴板直接粘贴截图,方便上下文共享
- 文档检索:基于 Flashduty 知识库的智能检索与回答
外部故障提交
新增 外部故障提交 功能,允许外部用户(如客户或合作伙伴)在无需登录的情况下提交故障:- 支持通过 API 或独立页面提交故障
- 提交时可上传截图等附件
- 自动匹配分派策略进行故障分派
SSO 子域名登录
支持为租户配置专属子域名,成员可通过子域名直接登录,简化 SSO 认证流程:- 账户管理员可配置专属登录子域名
- 支持基于子域名的账户自动切换
- SSO 同步用户支持设置为不可编辑,防止手动修改覆盖 SSO 数据
其他优化
- 故障元数据手动覆盖:支持手动修改故障标题、描述和严重程度
- 语音通知模板:语音通知支持自定义模板,不再局限于固定格式
- Webhook 自定义 Payload:故障 Webhook 支持用户自定义请求体格式
- 通过 alert_key 推送评论:新增 API,可通过告警 key 向关联故障推送评论
- 作战室消息上限提升:作战室消息数量上限提升,支持更完整的故障沟通记录
新增告警集成
新增五个监控系统的告警集成,进一步扩展 Flashduty 的数据接入能力:- 京东云(JD Cloud):支持京东云监控告警接入
- 金山云(KS Cloud):支持金山云监控告警接入
- UCloud:支持 UCloud 监控告警接入
- Harbor:支持 Harbor 镜像仓库告警接入
- Nagios:支持 Nagios 监控告警接入
Monitors 活跃告警
Monitors 模块新增 活跃告警 功能,提供当前正在触发的告警的实时视图:- 按文件夹浏览活跃告警
- 支持基于标签的灵活筛选
- 兼容 Prometheus 标签值查询接口(
/api/v1/label/:label/values)
其他优化
- 自定义操作字段扩展:自定义 Webhook 操作支持更多字段
- 飞书作战室聊天历史:支持获取飞书作战室的群聊消息记录
- Webhook 免密验证:Webhook 集成支持跳过密钥验证
- 自定义 Webhook 重试:自定义 Webhook 支持配置重试条件和自动重试
RUM 移动端 Source Map
RUM 模块现已支持 iOS 和 Android 应用 的 Source Map 上传与解析:- 上传移动端 Source Map 文件后,错误堆栈将自动还原为可读的源码位置
- 支持 iOS dSYM 和 Android Proguard/R8 映射文件
RUM 错误采集排除规则
新增 错误采集排除规则,允许配置规则过滤不需要关注的错误:- 按错误类型、消息内容等条件设置排除规则
- 排除的错误不再计入采集量
Issue 预设严重程度
支持为不同类型的 Issue 预设严重程度级别,新产生的 Issue 将自动应用预设等级。Monitors Edge 增强
- VictoriaLogs 支持:新增 VictoriaLogs 数据源,支持原始查询
- Fluent-bit 集成:新增 Fluent-bit 数据源接入
- Loki 查询优化:支持
loki.start/loki.end时间参数优先,支持原始查询模式 - 模板函数扩展:告警规则模板新增
timeFormat函数和 Sprig 模板函数库
Flashduty MCP Server V2
Flashduty MCP Server 完成全面重写,为 AI 工具(如 Claude)提供更强大的 Flashduty API 接入能力:- 精简工具集,提升交互效率
- 新增
/mcp端点 - 支持结构化日志与链路追踪
服务中断不可避免,但信任不应随之掉线。Flashduty 状态页的推出旨在打破信息不透明的困局:从源头上降低重复工单与其被动回应,不如让信息先行。状态页为用户提供随时可查的服务状态,同时支持订阅服务更新。一旦发生故障,最新进展会自动推送给订阅者。让服务维护透明可控状态页不仅通报突发故障,也让计划内的维护一目了然。通过提前公布维护窗口,用户可以清楚了解服务调整的时间与影响范围。用数据证明稳定性状态页自动沉淀历史可用性数据,将抽象的 SLA 承诺转化为直观、可验证的 Uptime 记录。欢迎前往 Flashduty 控制台 → On-call → 状态页面 进行体验。
本次更新对 Alert Routing(告警路由) 能力进行了全面增强:
1. 支持 Name Mapping 自动路由新增 Name Mapping 能力,可根据告警中的
1. 支持 Name Mapping 自动路由新增 Name Mapping 能力,可根据告警中的 labels 值,自动将告警路由到与该值同名的协作空间(Channel / Workspace)。示例:labels.application_name = "order-service"- 告警将自动路由到名为
order-service的协作空间
- 支持路由规则拖拽排序,灵活调整规则优先级
- 优化规则内容展示,条件与动作更直观清晰
- 整体布局更清爽,减少配置与排查成本
作战室
紧急故障处理往往争分夺秒,如何快速拉齐团队、高效协同是关键。现在,您可以一键拉起作战室:
- 即时建群:一键创建飞书、钉钉、企微或 Slack 群聊,自动邀请处理人与相关方入群
- 消息同步:故障消息卡片自动投递至群内,始终置顶并实时更新最新状态
Webhook 调用历史
排查 Webhook 调用问题不再需要”盲猜”。系统现已支持完整的调用记录追溯:
- 调用状态与错误码
- 重试次数
- 完整的请求与响应信息
历史变更
大幅增强变更事件管理能力:
- 动态路由:变更事件可按业务自动路由至相关协作空间
- 标签增强:支持对上报事件进行二次加工
- 全新视图:历史变更页面焕新升级,支持自定义视图
其他优化
- 故障列表:支持批量分派故障
- 新奇故障:支持关闭新奇故障检测
- 风暴提醒:支持配置多个风暴阈值,实现阶梯式递进提醒
- 分派策略:群聊渠道配置中可指定应用的严重程度
- 故障详情:支持自定义标签排序,支持以 JSON 格式展示故障标签
- 集成中心:新增 Zoho ServiceDesk Plus 和 Cloudflare 集成
AI 总结
新增 AI 总结功能,快速提炼故障详情,特别适用于聚合大量告警的场景:
总结聚焦于:- 事件概况(关键信息)
- 影响范围(资源、服务等)
- 可行措施(排查、止损、预防)
ServiceNow 集成
新增 ServiceNow 集成,支持故障信息双向同步:
- 支持手动和自动触发同步
- 支持 Flashduty 与 ServiceNow 双向同步
移动端应用优化
全新 Flashduty 移动端应用已上线各应用市场:
- 新增英文版本支持
- 集成 AI 总结功能
- 故障详情新增自定义字段,优化标签展示与文本编辑体验
分析看板
分析看板现支持按标签和自定义字段筛选故障:
Microsoft Teams
Teams 应用现支持向频道或群组发送故障分派通知:
企业微信/Zoom/飞书机器人

- 支持上传飞书等平台的邮箱与账户 ID 映射关系
- 分派策略支持绑定映射关系,实现群聊推送中的精准 @ 提醒
标签增强功能自推出以来广受好评,特别是在结合 mapping 数据进行标签映射方面。
现在,我们在控制台新增了映射数据管理功能,让您可以直接在界面上便捷地操作数据,无需依赖 API。
现在,我们在控制台新增了映射数据管理功能,让您可以直接在界面上便捷地操作数据,无需依赖 API。正式发布 告警处理 Pipeline 功能,并全面优化了集成交互体验。
现在,您可以轻松实现等级重设、标题修改、过滤、CMDB 联动等多种操作。更新亮点:
现在,您可以轻松实现等级重设、标题修改、过滤、CMDB 联动等多种操作。更新亮点:- 新增告警处理功能:支持多种执行动作
- 优化标签增强和路由规则配置交互:新增右侧告警历史面板,助力规则调试
推出了完整的英文支持,覆盖控制台、帮助文档以及开发者文档:

- 浏览语言设置:所有成员现在可以在控制台中自由切换浏览器显示语言
- 通知语言设置:账户主体可在”账户设置”中选择通知的默认语言

- 全新 UI 交互设计
- 全新故障列表页,新增支持丰富筛选
- 全新故障详情页,支持常用操作与自定义操作
- 新增支持故障创建,支持策略与直接分派
- 新增支持暗黑主题切换
变更前
- 故障分派通知之前匹配静默或抑制策略,匹配到则进行故障通知拦截
- 告警事件投递过程中匹配静默或抑制策略,匹配到则进行故障生成拦截
- 被拦截的告警将不再触发或合入故障
- 您可选择保留或丢弃被拦截的告警
- 控制台点击自定义操作前进行二次确认
- 新创建的协作空间展示在前边
- 创建故障页面,增加分派策略指定,支持 markdown 描述
- 分派记录展示动态分派重置标识
- 核心功能点附近增加视频演示入口
- 分派策略单聊统一配置支持某个等级不设置通道
- 故障重新分派去掉当前人员

- 支持 Zabbix v7 版本告警接入
- 支持 InfluxData v2 版本告警接入
- 支持 Meraki 告警接入
- 支持 Zoho OpManager 告警接入



























