可观测性技能 — 日志、监控、告警、分布式追踪的最佳实践与实施指南
以下场景出现时自动激活本技能:
在编写任何代码之前,先明确服务的可靠性目标。
参考:监控与告警
结构化日志是可观测性的基础。
参考:日志
基于 SLO 构建监控体系。
告警必须可操作,避免告警疲劳。
参考:监控与告警
| 支柱 | 用途 | 核心问题 |
|---|---|---|
| 日志(Logs) | 记录离散事件 | 发生了什么? |
| 指标(Metrics) | 聚合数值度量 | 系统表现如何? |
| 追踪(Traces) | 跨服务请求链路 | 请求经过了哪些环节? |
三者缺一不可。日志提供上下文,指标提供趋势,追踪提供因果链。
实施可观测性后,逐项确认:
/health、/ready)已实现# Observability: {目标系统}
## 监控状况
{日志/指标/链路追踪的实现状况}
## 告警设置
{已配置的告警规则}
## 仪表盘
{已创建/更新的仪表盘}
## 设计审查
{审查结果清单,标记通过/未通过}