核心价值
降低沟通成本
通过”一次更新,多方同步”机制,结合订阅推送模式,从源头减少重复问询,让技术团队专注于问题修复。
构建长期信任
主动公布突发故障与维护计划,消除信息不对称引发的猜测,在不确定性中展现专业度与掌控力。
稳定性资产化
持续记录状态变更,生成可视化的可用性统计,将抽象的 SLA 承诺转化为可验证的运行记录。
状态页类型
针对不同受众的需求差异,Flashduty 提供两种状态页:- 公开状态页
- 内部状态页
面向客户与合作伙伴
- 对所有公网用户开放,无需登录即可访问
- 帮助企业在故障期间向客户提供实时、准确的服务状态更新
- 主动传递关键信息,缓解客户焦虑,塑造专业品牌形象
- 用户可通过电子邮件订阅事件更新
核心概念
组件与分组
状态页通过组件(Component)来组织和呈现不同的服务,相关联的组件可进行分组(Grouping),使状态页结构更加清晰。事件类型
| 类型 | 说明 |
|---|---|
| 故障(Incident) | 意外发生的影响服务可用性的事件 |
| 维护(Maintenance) | 计划内的事件,用于提前通知用户可能的服务变动 |
影响状态
- 故障影响状态
- 维护影响状态
按严重程度递增:
- 🟢 运行正常(Operational)
- 🟡 性能下降(Degraded Performance)
- 🟠 部分中断(Partial Outage)
- 🔴 完全中断(Full Outage)
常见问题
状态页(Status Page)和在线状态监控(Uptime Monitor)的区别?
状态页(Status Page)和在线状态监控(Uptime Monitor)的区别?
状态页(例如 Flashduty Status Page)和在线状态监控(例如 Uptime Kuma)都提供了展示服务可用性的看板。二者的不同之处如下:
如果您需要简单的自监控工具实现服务探活(例如域名探活,端口探活等),推荐使用在线状态监控工具。如果您需要实现面向外部客户或内部组织的正式服务状态看板和通知系统,推荐使用 Flashduty 状态页。
| 状态页 | 在线状态监控 | |
|---|---|---|
| 受众 | 外部客户 & 组织内跨部门沟通 | 内部运维 & 技术团队 |
| 典型部署方式 | 第三方托管 | 自托管 |
| 监控原理 | 自身不负责监控探测,依赖事件上报 | 自身负责监控探测 |
| 监控能力 | 复杂的事件信息,包括受影响服务,严重程度,生命周期等 | 简单的网站 / API / DNS / 端口等服务探活 |
| 通知能力 | 用户自助订阅通知 | 运维配置时指定通知渠道 |
| 侧重点 | 技术团队在处理故障和安排维护时,通过发布事件实现透明的内外沟通 | 通过简单的监控原理(定期 Ping)产生告警,作为故障通知触达技术团队 |
谁可以访问状态页?谁可以管理状态页?
谁可以访问状态页?谁可以管理状态页?
访问权限
- 公开状态页:对所有公网用户开放,无需登录即可访问。
- 内部状态页:仅限组织内部用户访问,需使用对应的 Flashduty 账号登录。
- 状态页管理:创建、编辑和删除状态页,管理订阅。
- 状态页事件管理:在状态页中发布、编辑和删除事件。
状态页支持发布哪些事件?
状态页支持发布哪些事件?
Flashduty 状态页支持两类事件:故障(Incident)和维护(Maintenance)。
- 故障是意外发生的影响服务可用性的事件。
- 维护是计划之内的事件,用于提前通知用户可能的服务可用性变动。
如何向状态页中发布事件?
如何向状态页中发布事件?
目前,向 Flashduty 状态页中发布事件需要在状态页管理页面中手动声明。为了简化事件的发布流程,Flashduty 状态页支持事件模板,让技术团队能够通过模板快速发布故障或计划维护,只需少量操作即可生成完整的状态更新。在不久的将来,我们还将为 Flashduty Oncall 的故障管理部分提供 Workflow 支持。届时,Flashduty 将支持通过编写预设规则,为推送到平台的故障自动在相关状态页上发布对应事件,实现 Oncall 故障与状态页的无缝衔接。
状态页中的服务是如何划分的?
状态页中的服务是如何划分的?
Flashduty 状态页通过组件(Component)来组织和呈现不同的服务。组件代表系统或服务中的具体功能模块,基于组件的状态页架构可以将整体服务拆分为多个独立的功能单元,从而清晰地界定事件对不同服务的影响范围。相关联的组件可进行分组(Grouping),使状态页结构更加清晰有序。故障对组件的影响状态可按严重程度进行划分:
- 运行正常(Operational)
- 性能下降(Degraded performance)
- 部分中断(Partial Outage)
- 完全中断(Full outage)
- 运行正常(Operational)
- 维护中(Under maintenance)
用户如何订阅状态页更新?
用户如何订阅状态页更新?
Flashduty 状态页允许用户主动订阅服务状态更新。在向状态页内发布事件时,可以选择是否为该事件向订阅者发送通知,从而灵活控制信息推送。
-
对于公开状态页,用户可通过电子邮件接收事件更新。
-
对于内部状态页,用户可在 Flashduty 的通知配置中绑定偏好的 IM 集成,实现 IM 平台内的单聊通知的实时推送。Flashduty 目前实现了对飞书、钉钉、企业微信、Slack 的通知支持。
状态页的用户必须订阅所有更新吗?还是可以选择特定服务?
状态页的用户必须订阅所有更新吗?还是可以选择特定服务?
用户可灵活选择订阅范围,既可以接收状态页的全部更新,也可以仅订阅特定服务或事件。基于服务组件和事件的订阅确保用户只收到与其实际使用相关的更新,从而减少不必要的通知干扰。
状态页的服务可用性统计指标的计算原理?
状态页的服务可用性统计指标的计算原理?
组件的部分中断(Partial outage)或完全中断(Full outage)会计入该组件的不可用时间(Downtime)。虽然维护可能对服务产生影响,但其影响时间不计入服务可用性统计(Service uptime)。组件的服务可用性统计基于最近一个季度的数据窗口计算,其值等于组件的可用时间(Uptime) 和总存在时间(Available time)的比值。分组的可用性统计同样以季度为单位计算,其值等于该分组下所有组件的可用时间之和与总存在时间之和的比值。
状态页是否支持上传历史服务可用性数据?
状态页是否支持上传历史服务可用性数据?
有时,技术团队往往需要优先投入资源进行排查和修复,无法同步、完整地更新状态页;在系统迁移时,也需要将既有的可用性记录呈现在状态页中。Flashduty 状态页提供发布回溯事件(Retrospective event)能力,用于补充已发生但未能及时对外发布的服务状态变化。通过回溯事件,用户可以事后声明一次已经发生的故障或维护,并准确设置事件的发生时间、结束时间以及受影响的组件。和普通事件相同,用户同样可以按真实时间顺序构建事件更新的时间线,清晰呈现服务在整个事件周期内的状态变化。回溯事件在状态页中的展示方式与普通事件一致,都会纳入事件历史和服务可用性统计,帮助用户全面理解服务的实际运行情况。
状态页如何收费?
状态页如何收费?
Flashduty 状态页是 Oncall 模块 的一部分,不单独进行售卖。不同版本的 Flashduty 账户在状态页数量上的支持如下:
- Flashduty 免费版、标准版:支持创建 1 个公开状态页
- Flashduty 专业版、私有化:支持创建 5 个公开状态页,支持创建 20 个内部状态页。
- 公开状态页的邮件通知受不同 Flashduty 版本的邮件用量约束。
- 内部状态页的 IM 推送通知受不同 IM 平台的 API 调用限额约束,通常和组织使用的 IM 定价方案有关。
- 所有类型的状态页的访问流量均无上限。