count_over_time、rate、sum 等函数将日志转换为数值序列,以便进行阈值判定。mysql 任务中包含 error 关键字的日志条数。count_over_time({job="mysql"} |= "error" [5m])$A > 50(5 分钟内错误日志超过 50 条)$A > 10(5 分钟内错误日志超过 10 条)$A < 5,避免在阈值附近震荡。${label_name} 变量替换。count_over_time({job="mysql"} |= "recovered" [5m])。rate({job="ingress"} |= "500" [1m]) / rate({job="ingress"} [1m]) * 100 > 5> 5 的条件)时,判定恢复。rate({job="node-logs"} [1m])instance="host-1")在之前的周期中存在,但在当前及连续 N 个周期中查不到数据,则触发"数据缺失"告警。{job="mysql"} |= "error")。count_over_time(...)。[5m])应适中。过大的范围会导致查询慢,过小的范围可能导致数据波动大。{...} 内)使用精确的标签过滤,减少扫描的数据量。