跳转到主要内容
服务中断不可避免,但沟通效率可以系统性提升。 当服务状态发生波动时,依赖人工邮件或即时消息的通知方式,已难以满足企业对信息时效性和一致性的要求。Flashduty 状态页通过提供标准化、统一的信息发布窗口,确保企业内部与外部对服务状态的认知保持实时同步。
欢迎订阅 Flashduty 官方状态页,第一时间获取 Flashduty 服务状态更新。

核心价值

降低沟通成本

通过”一次更新,多方同步”机制,结合订阅推送模式,从源头减少重复问询,让技术团队专注于问题修复。

构建长期信任

主动公布突发故障与维护计划,消除信息不对称引发的猜测,在不确定性中展现专业度与掌控力。

稳定性资产化

持续记录状态变更,生成可视化的可用性统计,将抽象的 SLA 承诺转化为可验证的运行记录。

状态页类型

针对不同受众的需求差异,Flashduty 提供两种状态页:
面向客户与合作伙伴
  • 对所有公网用户开放,无需登录即可访问
  • 帮助企业在故障期间向客户提供实时、准确的服务状态更新
  • 主动传递关键信息,缓解客户焦虑,塑造专业品牌形象
  • 用户可通过电子邮件订阅事件更新

核心概念

组件与分组

状态页通过组件(Component)来组织和呈现不同的服务,相关联的组件可进行分组(Grouping),使状态页结构更加清晰。

事件类型

类型说明
故障(Incident)意外发生的影响服务可用性的事件
维护(Maintenance)计划内的事件,用于提前通知用户可能的服务变动

影响状态

按严重程度递增:
  • 🟢 运行正常(Operational)
  • 🟡 性能下降(Degraded Performance)
  • 🟠 部分中断(Partial Outage)
  • 🔴 完全中断(Full Outage)

常见问题

状态页(例如 Flashduty Status Page)和在线状态监控(例如 Uptime Kuma)都提供了展示服务可用性的看板。二者的不同之处如下:
状态页在线状态监控
受众外部客户 & 组织内跨部门沟通内部运维 & 技术团队
典型部署方式第三方托管自托管
监控原理自身不负责监控探测,依赖事件上报自身负责监控探测
监控能力复杂的事件信息,包括受影响服务,严重程度,生命周期等简单的网站 / API / DNS / 端口等服务探活
通知能力用户自助订阅通知运维配置时指定通知渠道
侧重点技术团队在处理故障和安排维护时,通过发布事件实现透明的内外沟通通过简单的监控原理(定期 Ping)产生告警,作为故障通知触达技术团队
如果您需要简单的自监控工具实现服务探活(例如域名探活,端口探活等),推荐使用在线状态监控工具。如果您需要实现面向外部客户或内部组织的正式服务状态看板和通知系统,推荐使用 Flashduty 状态页。
访问权限
  • 公开状态页:对所有公网用户开放,无需登录即可访问。
  • 内部状态页:仅限组织内部用户访问,需使用对应的 Flashduty 账号登录。
管理权限Flashduty 状态页的管理遵循 Flashduty 的 RBAC 权限模型。管理员可为账户成员分配以下两类角色:
  • 状态页管理:创建、编辑和删除状态页,管理订阅。
  • 状态页事件管理:在状态页中发布、编辑和删除事件。
Flashduty 状态页支持两类事件:故障(Incident)和维护(Maintenance)。
  • 故障是意外发生的影响服务可用性的事件。
  • 维护是计划之内的事件,用于提前通知用户可能的服务可用性变动。
目前,向 Flashduty 状态页中发布事件需要在状态页管理页面中手动声明。为了简化事件的发布流程,Flashduty 状态页支持事件模板,让技术团队能够通过模板快速发布故障或计划维护,只需少量操作即可生成完整的状态更新。在不久的将来,我们还将为 Flashduty Oncall  的故障管理部分提供 Workflow 支持。届时,Flashduty 将支持通过编写预设规则,为推送到平台的故障自动在相关状态页上发布对应事件,实现 Oncall 故障与状态页的无缝衔接。
Flashduty 状态页通过组件(Component)来组织和呈现不同的服务。组件代表系统或服务中的具体功能模块,基于组件的状态页架构可以将整体服务拆分为多个独立的功能单元,从而清晰地界定事件对不同服务的影响范围。相关联的组件可进行分组(Grouping),使状态页结构更加清晰有序。故障对组件的影响状态可按严重程度进行划分:
  • 运行正常(Operational)
  • 性能下降(Degraded performance)
  • 部分中断(Partial Outage)
  • 完全中断(Full outage)
维护对组件的影响状态可按严重程度进行划分:
  • 运行正常(Operational)
  • 维护中(Under maintenance)
Flashduty 状态页允许用户主动订阅服务状态更新。在向状态页内发布事件时,可以选择是否为该事件向订阅者发送通知,从而灵活控制信息推送。
  • 对于公开状态页,用户可通过电子邮件接收事件更新。 状态页邮件通知.png
  • 对于内部状态页,用户可在 Flashduty 的通知配置中绑定偏好的 IM 集成,实现 IM 平台内的单聊通知的实时推送。Flashduty 目前实现了对飞书、钉钉、企业微信、Slack 的通知支持。 状态页 IM 通知.png
用户可灵活选择订阅范围,既可以接收状态页的全部更新,也可以仅订阅特定服务或事件。基于服务组件和事件的订阅确保用户只收到与其实际使用相关的更新,从而减少不必要的通知干扰。
组件的部分中断(Partial outage)或完全中断(Full outage)会计入该组件的不可用时间(Downtime)。虽然维护可能对服务产生影响,但其影响时间不计入服务可用性统计(Service uptime)。组件的服务可用性统计基于最近一个季度的数据窗口计算,其值等于组件的可用时间(Uptime) 和总存在时间(Available time)的比值。分组的可用性统计同样以季度为单位计算,其值等于该分组下所有组件的可用时间之和与总存在时间之和的比值。
有时,技术团队往往需要优先投入资源进行排查和修复,无法同步、完整地更新状态页;在系统迁移时,也需要将既有的可用性记录呈现在状态页中。Flashduty 状态页提供发布回溯事件(Retrospective event)能力,用于补充已发生但未能及时对外发布的服务状态变化。通过回溯事件,用户可以事后声明一次已经发生的故障或维护,并准确设置事件的发生时间、结束时间以及受影响的组件。和普通事件相同,用户同样可以按真实时间顺序构建事件更新的时间线,清晰呈现服务在整个事件周期内的状态变化。回溯事件在状态页中的展示方式与普通事件一致,都会纳入事件历史和服务可用性统计,帮助用户全面理解服务的实际运行情况。
Flashduty 状态页是 Oncall 模块 的一部分,不单独进行售卖。不同版本的 Flashduty 账户在状态页数量上的支持如下:
  • Flashduty 免费版、标准版:支持创建 1 个公开状态页
  • Flashduty 专业版、私有化:支持创建 5 个公开状态页,支持创建 20 个内部状态页。
我们推荐客户按照业务线或者大平台维度来规划和管理内部状态页。如您对状态页数量有特殊的需求,欢迎联系 Flashduty 客服或技术支持进行咨询。在通知用量和访问控制方面:
  • 公开状态页的邮件通知受不同 Flashduty 版本的邮件用量约束。
  • 内部状态页的 IM 推送通知受不同 IM 平台的 API 调用限额约束,通常和组织使用的 IM 定价方案有关。
  • 所有类型的状态页的访问流量均无上限。