Flashduty Docs
中文EnglishRoadmapAPI官网控制台
中文EnglishRoadmapAPI官网控制台
  1. 快速开始
  • 快速开始
    • 入门介绍
    • 快速开始
    • 常见问题
    • 产品对比
  • 故障管理
    • 什么是故障
    • 检索与查看故障
    • 处理与更新故障
    • 升级与分派故障
    • 自定义字段
    • 自定义操作
    • 了解降噪过程
    • 了解历史故障
    • 了解新奇故障
  • 配置Flashduty
    • 协作空间管理
    • 多种方式接入告警
    • 配置路由规则
    • 配置标签增强
    • 配置告警降噪
    • 配置分派策略
    • 故障静默与抑制
    • 配置值班规则
    • 配置通知模板
    • 配置服务日历
    • 配置个人信息
    • 配置过滤条件
    • 通知机器人
    • 告警处理 pipeline
  • 平台功能
    • 团队和成员
    • 了解权限设计
    • 配置单点登录
    • 分析数据
  • 高级功能
    • 引用变量
    • 动态分派
  • 集成引导
    • 告警集成
      • 邮件 Email 集成指引
      • 夜莺 Flashcat 集成指引
      • Prometheus 集成指引
      • 标准告警事件集成指引
      • Grafana 集成指引
      • Zabbix 集成指引
      • Uptime Kuma 集成指引
      • 阿里云 ARMS 集成指引
      • 阿里云监控 CM 事件集成指引
      • 阿里云监控 CM 指标集成指引
      • 阿里云 SLS 集成指引
      • AWS CloudWatch 集成指引
      • Azure Monitor 集成指引
      • 百度云监控 BCM 集成指引
      • 华为云监控 CES 集成指引
      • 腾讯云 CLS 集成指引
      • 腾讯云监控 CM 集成指引
      • 腾讯云 Event Bridge 集成指引
      • Influxdata 集成指引
      • Open Falcon 集成指引
      • Pagerduty 集成指引
      • 蓝鲸智云集成指引
      • OceanBase 集成指引
      • Graylog 集成指引
      • Skywalking 集成指引
      • Sentry 集成指引
      • 监控宝告警集成指引
      • AWS EventBridge 集成指引
      • Dynatrace 集成指引
      • 华为云 LTS 集成指引
      • GoogleCloud 集成指引
      • Splunk 集成指引
      • AppDynamics 集成指引
      • SolarWinds 集成指引
      • 火山引擎CM 指标集成指引
      • 火山引擎CM 事件集成指引
      • 火山引擎日志服务 TLS 集成指引
      • Opmanager 告警事件
      • Meraki 告警事件
      • 天翼云告警集成
      • 观测云告警事件
      • zilliz 告警事件
      • 华为云 APM 告警事件
      • zstack 告警事件
      • Keep 告警集成指引
      • ElastAlert2 告警集成
    • 即时消息
      • 飞书 Lark 集成指引
      • 钉钉 Dingtalk 集成指引
      • 企业微信 Wecom 集成指引
      • Slack 集成指引
      • Microsoft Teams 集成指引
    • 单点登录
      • Authing 集成指引
      • Keycloak 集成指引
      • OpenLDAP 集成指引
    • Webhooks
      • 告警 webhook
      • 故障 webhook
      • 自定义操作
    • 变更集成
      • 标准变更事件集成指引
  • 服务协议
    • 服务条款
    • 用户协议/隐私政策
    • SLA承诺
    • 数据安全
  1. 快速开始

产品对比

前言#


在当今快速变化的IT环境中,组织越来越依赖于一套综合的监控和事件管理工具来确保业务连续性和服务稳定性。然而,随着监控系统的不断扩展,海量的警报和事件通知也随之产生,这给IT团队带来了前所未有的挑战。如何确保每一条告警都能被及时捕捉、准确投递,并得到有效响应,已成为确保服务质量的关键。
面对这一挑战,我们发现以下情况表明组织需要引入或升级其On-Call工具:
全面跟踪与解决:确保每一条故障都能够得到跟踪、处理和解决,防止问题扩大,从而避免更大的资产损失。
值班机制的建立:建立明确的On-Call人员值班机制,包括主备轮班制度,合理分担责任,避免告警信息泛滥。
提升响应效率:当SRE或研发人员在日常On-Call工作中的投入超过25%,需要工具来降低噪音并提升工作效率。
量化指标的建立:建立故障处理时效和人员负载的量化指标,以数据驱动服务稳定性的持续改进。
“在采购On-Call服务时,我们应该考虑哪些关键因素?” 本指南将为您提供全面的 On-Call 工具采购建议,我们将从产品、服务与价格三个维度出发,探讨IT管理人员在为其开发和运维团队寻找高效协作的故障管理解决方案时应该提出的问题。同时,针对每个细分维度,我们还会提供国内外主流On-Call供应商如 Flashduty 和 Pagerduty 的对比分析,以助您做出明智的选择。

产品#


集成能力#

故障管理系统作为流程处置中心,存储了全部的告警和故障数据。此类系统应该支持强大的数据接入和外呼能力,以便和其他各类系统或工作流集成,加速响应、增强协同。
产品能力应该提出的问题Flashduty vs. Pagerduty
告警集成1. 是否支持您常用的告警系统?
2. 是否支持自定义告警集成?通过标准协议上报自研脚本监控数据?
3. 是否支持邮件集成?通过邮件触发或关闭故障?
4. 是否支持变更类集成?
故障一般由变更导致,集成变更有助于快速排障。
5. 集成文档是否易于查找,文字是否明确?
是否可以根据文档自助完成配置?
Flashduty ✅,Pagerduty ✅
Pagerduty 支持海外大部分监控工具。
Flashduty 支持国内外主流监控工具,也同时支持Pagerduty协议,部分工具可直接按Pagerduty方式将数据推送给Flashduty。
Webhooks1. 是否支持故障操作对外推送 Webhook?以便集成自研流程或工具?
2. 是否支持针对事件类型或来源进行订阅?比如单独订阅所属订单系统的故障分派事件?
Flashduty ✅,Pagerduty ✅
Open APIs是否支持丰富的 Open API,可以让客户通过 API 操作数据实体?Flashduty ✅,Pagerduty ✅
二者均提供丰富的 API 和说明文档。

故障处置#

故障处置为系统的核心操作,该维度下主要考察产品功能的丰富度和灵活性。
产品能力应该提出的问题Flashduty vs. Pagerduty
告警路由1. 是否支持专属集成?
无需路由直接到服务或协作空间?
2. 是否支持共享集成?以及灵活的路由规则?
Flashduty ✅,Pagerduty ✅
Pagerduty 仅支持共享的 integration_key,没有共享集成概念。 Flashduty 可以支持在集成页面设置路由规则,Pagerduty 则需通过复杂的 Event Orchestration 或 Workflow 来实现。
信息增强是否支持设定自定义字段?
增加字段,定义类型和枚举值,对故障信息进行扩展
Flashduty ✅,Pagerduty ✅
是否支持通过已有信息正则提取出新的标签?
eg. 通过主机名提取出机房信息
Flashduty ✅,Pagerduty ✅
是否支持通过已有信息组合出新的标签?
eg. 通过服务和告警策略,生成 runbook 地址
Flashduty ✅,Pagerduty ✅
是否支持导入数据表,动态生成新标签?
eg. 导入 CMDB 数据,根据主机 ip 自动生成 owner 信息
Flashduty ✅,Pagerduty ❌
Flashduty支持灵活的数据映射方案。
告警降噪是否支持告警聚合为故障?
1. 将相似的告警聚合到一起进行分派和通知以及处理,提升效率,减少告警疲劳?
2. 是否按照时间窗口聚合故障?
3. 是否支持基于 AI 进行合并?
Flashduty ✅,Pagerduty ✅
Pagerduty 支持智能聚合与策略聚合。
Flashduty 支持细粒度控制的策略聚合。
是否支持故障屏蔽?
在休市或系统维护期间,停止告警通知?
Flashduty ✅,Pagerduty ✅
是否支持故障抑制?
比如宿主机发生故障,抑制 pod 故障?
Flashduty ✅,Pagerduty ❌
是否支持风暴预警?
当故障聚合告警数量太多,再次通知提升响应力度?
Flashduty ✅,Pagerduty ❌
是否支持故障抖动收敛?
相同的故障频繁发生与恢复,应该适当减少通知,避免精力浪费。
Flashduty ✅,Pagerduty ❌
是否支持故障延迟通知?
延后一个窗口通知故障,过滤掉那些发生后立即自动恢复的故障,减少精力浪费。
Flashduty ✅,Pagerduty ✅
故障分派是否支持故障按策略分派?
1. 是否支持分派给值班、团队或个人?
2. 是否支持同时设定群聊或单聊通知方式?
Flashduty ✅,Pagerduty ✅
Flashduty 额外支持分派到团队以及设定通知方式。
Pagerduty 仅能全局配置单聊和群聊,无法匹配到故障层面。
是否支持按条件匹配进行分派?
1. 是否支持多个分派策略按权重匹配?
Flashduty ✅,Pagerduty ❌
Pagerduty 在一个 Service 下仅支持一个升级策略。
Flashduty 支持在一个协作空间下配置多个分派策略,每个策略可以在不同时间或匹配故障范围生效。
是否支持故障超时未解决自动升级?
1. 是否支持手动升级?
Flashduty ✅,Pagerduty ✅
是否支持基于参数或标签动态进行分派?
1. 根据标签动态替换分派人员,降低系统打通成本?
2. 根据标签动态替换群聊信息?降低配置维护成本?
Flashduty ✅ ,Pagerduty ❌
故障处理是否支持手动创建故障?Flashduty ✅,Pagerduty ✅
是否支持故障认领、关闭、评论、暂缓与合并?
1. 是否支持超时自动关闭?
2. 是否支持暂缓超时自动取消?
Flashduty ✅,Pagerduty ✅
是否支持故障复盘?Flashduty ❌,Pagerduty ✅
是否支持相似故障?Flashduty ✅,Pagerduty ✅
是否支持新奇故障提醒?Flashduty ✅,Pagerduty ❌
是否支持详细的操作记录?Flashduty ✅,Pagerduty ✅
是否支持故障重新分派?Flashduty ✅,Pagerduty ✅
是否支持对故障添加自定义操作?
比如手动触发主机重启来故障自愈?
Flashduty ✅,Pagerduty ✅
是否支持故障关闭后重新打开以及通知?Flashduty ✅ ,Pagerduty ❌
是否支持设定自定义字段?
比如标记误报、添加会议链接等?
Flashduty ✅,Pagerduty ✅
双方均支持多种类型的自定义字段。
Flashduty 支持按照字段检索故障。
Pagerduty 仅能在故障详情中查看字段设置。
是否拥有强大的检索能力?Flashduty ✅ ,Pagerduty ❌
Flashduty 支持按照标签、自定义字段、标题、人员信息进行检索。
Flashduty 支持精确、通配以及正则匹配。
Flashduty 支持卡片角视图。
Flashduty 支持故障列表自定义渲染内容。
故障分析是否支持依据时间、团队、服务等维度统计故障和事件数量?Flashduty ✅,Pagerduty ✅
是否支持依据时间、团队和服务等维度通知故障的处理指标?
如 MTTA 和 MTTR?
Flashduty ✅,Pagerduty ✅
是否支持统计人员处理故障指标?
如 MTTA?如处理故障数量?
Flashduty ✅,Pagerduty ✅
是否支持统计最频繁发生故障的主机和策略?Flashduty ✅,Pagerduty ❌
是否支持统计人员处理故障耗费的时间?Flashduty ✅,Pagerduty ✅
是否支持按不同时段(工作、休息和睡眠)统计指标?Flashduty ✅,Pagerduty ❌
是否支持自定义统计报表?Flashduty ❌,Pagerduty ❌
是否支持定期发送统计报表?Flashduty ❌,Pagerduty ❌
是否支持大屏展示分析看板?Flashduty ❌,Pagerduty ❌
是否支持下载数据明细?Flashduty ✅,Pagerduty ✅

平台能力#

平台能力主要在成员管理、值班响应和通知能力层面,系统要具备基本的审计和单点登录功能。通知渠道越丰富越好,本地化支持越多越好,值班管理最好能满足组织内的特殊场景。
产品能力应该提出的问题Flashduty vs. Pagerduty
值班管理是否支持按照天、周或自定义周期进行轮换?Flashduty ✅,Pagerduty ✅
是否支持限定轮换周期内的值班时间?Flashduty ✅,Pagerduty ✅
是否支持跳过特定日期进行值班轮换(如工作日和非工作日使用不同的轮换规则)?Flashduty ✅,Pagerduty ❌
是否支持不同时间段不同轮换规则?Flashduty ✅,Pagerduty ✅
Flashduty 可以设置周期结束时间。
是否支持设置临时调班?Flashduty ✅,Pagerduty ✅
是否支持设置值班角色?比如主备值班?Flashduty ✅,Pagerduty ❌
是否支持同时多人值班?一起轮换?Flashduty ✅,Pagerduty ❌
是否支持公平轮换?
比如 7 个人按天轮换,那么张三永远在周日值班是否公平?
Flashduty ✅,Pagerduty ❌
是否支持设定轮换通知包括提前通知?Flashduty ✅,Pagerduty ✅
Flashduty 支持更多通知方式
是否支持值班日历导出?Flashduty ❌,Pagerduty ✅
通知渠道是否支持国内语音和短信?Flashduty ✅,Pagerduty ✅
Pagerduty 受限支持,不稳定
是否支持固定显号?Flashduty ✅,Pagerduty ✅
是否支持邮件通知?Flashduty ✅,Pagerduty ✅
是否支持国内主流 IM 应用协同?Flashduty ✅,Pagerduty ✅
Flashduty 支持:飞书、钉钉、企微应用集成。
是否支持国外主流 IM 应用协同?Flashduty ✅,Pagerduty ✅
二者均支持 Slack 和 Microsoft Teams应用。
Flashduty 额外支持 Zoom 和 Telegram 机器人。
是否支持移动端 App?Flashduty ✅,Pagerduty ✅
是否支持自定义通知模板?Flashduty ✅ ,Pagerduty ❌
Flashduty 支持丰富的模板语法。
单点登录是否支持单点登录? 支持哪些协议?Flashduty ✅,Pagerduty ✅
Flashduty 支持 SAML、OIDC;
Pagerduty 支持 SAML、Oauth2
操作审计是否支持操作审计?Flashduty ✅,Pagerduty ✅

价格#


供应商一般提供多种订阅方式。但我们主要考虑在满足自身需求的情况下,哪一款更具性价比。确保实际使用不超预算,计价方式的简单性都很重要。
对比项FlashdutyPagerduty
价格页面price.flashcat.cloudprice.pagerduty.com
收费方式席位费+超额通信费用席位费+Add-Ons
版本区分专业版 ¥199/人/月 全功能(包括AIops)Business 版本 $41/人/月, Add-Ons 单独收费(如 AIops)
是否仅收取活跃用户费用?是, 活跃用户标准为当月查看或处理故障的成员,仅接收通知不算作活跃用户否, 处理告警需要买 full license,仅接收告警需要买 stake holder license 包,50 个起卖,每个$3/人/月
免费试用专业版 14 天免费,可以申请延长Business 版本 14 天免费

服务#


服务维度主要考察供应商服务响应的方式以及时效性,即时消息远比其他方式要好。
对比项FlashdutyPagerduty
是否提供 Email 支持?✅✅
是否提供专属支持?✅,支持专属 IM 服务群需要单独购买
是否提供专家远程支持?✅,支持远程会议解决问题需要单独购买
服务时间标准版:5*8,专业版:7*8未知
是否提供 Status Page?是,status.flashcat.cloud是,status.pagerduty.com
是否提供 Roadmap?是,roadmap.flashcat.cloud否

最后#


我们建议您寻找能够根据您的需求进行定制,并适应您不同工作流程的解决方案。这主要取决于您对供应商的警报和通知工作流程、集成、排班和升级、定价以及其他各种功能的满意程度。建议您全面试用评估后选择。
上一页
常见问题
下一页
什么是故障
Built with