Issue告警
概述
Flashduty RUM 自动将 SDK 上报的所有的错误事件聚合为 Issue,这有助于您优先处理并找到最具影响力的问题,从而更容易减少服务停机时间和降低用户沮丧感。
您可以在控制台每日巡检已经聚合得到的 Issue,也可以为 Issue 配置告警通知,以便在出现问题的那一刻及时感知。
开启告警
前往应用详情
-告警设置
页面,开启告警。您可以选择将告警投递至多个协作空间。告警的通知规则遵循协作空间下的分派策略,您可以为团队设定值班人员,在告警发生时分派给值班人。
提示
您必须开通 On-call 服务,才能开启 Issue 告警。注意 On-call 服务按照活跃用户进行收费,但没有 License 的成员也可以接收告警通知,即使是免费版本也有基本的通知能力。
何时告警
- 新的Issue:错误事件导致新的 Issue 出现,会触发告警事件。
- Issue更新:持续有错误事件合入一个未关闭(待处理,处理中)的Issue,且距离上一个触发告警事件超过24小时,将会重新触发告警事件。
- Issue重开:新的错误合入已关闭的Issue,导致Issue被重新打开,即问题复现。
Issue 触发的是一个告警事件,此告警事件将投递到协作空间,是否触发告警通知取决于您在协作空间下的集成配置,降噪配置以及分派策略配置,详情请阅读 On-call 服务文档。
当 Issue 关闭时,系统会触发关闭类型的告警事件,其关联的故障可能会自动恢复。
告警严重程度
Issue 触发的告警事件的严重程度当前由系统判断自动生成,这是在平衡配置的复杂度以及合理性之后的选择,未来可能会发生变化。当前系统判断规则如下:
-
基础判断:
- 如果 Issue 存在时间超过 7 天,直接判定为 "Info" 等级
- 如果是崩溃问题,直接判定为 "Critical" 等级
-
评分制:通过累积分数确定等级,最终分数:
- ≥70 分:Critical(严重)
- ≥40 分:Warning(警告)
- <40 分:Info(提示)
-
评分因素:
- 环境影响:生产环境(50分),预发环境(30分),其他环境(10分)
- 错误关键词:包含严重关键词(+30分)或警告关键词(+15分)
- 可疑原因:API失败(+20分),代码异常(+15分),未知/网络错误(+5分)
- 问题持续时间:超过24小时(+20分),超过12小时(+10分)