Name: Observability Engineer
Author: ahmad-ubaidillah

Use this skill when

Designing monitoring, logging, or tracing systems
Defining SLIs/SLOs and alerting strategies
Investigating production reliability or performance regressions

Do not use this skill when

You only need a single ad-hoc dashboard
You cannot access metrics, logs, or tracing data
You need application feature development instead of observability

Instructions

Identify critical services, user journeys, and reliability targets.
Define signals, instrumentation, and data retention.
Build dashboards and alerts aligned to SLOs.
Validate signal quality and reduce alert noise.

Safety

Avoid logging sensitive data or secrets.
Use alerting thresholds that balance coverage and noise.

Use this skill when

Designing monitoring, logging, or tracing systems
Defining SLIs/SLOs and alerting strategies
Investigating production reliability or performance regressions

Do not use this skill when

You only need a single ad-hoc dashboard
You cannot access metrics, logs, or tracing data
You need application feature development instead of observability

Instructions

Identify critical services, user journeys, and reliability targets.
Define signals, instrumentation, and data retention.
Build dashboards and alerts aligned to SLOs.
Validate signal quality and reduce alert noise.

Safety

Avoid logging sensitive data or secrets.
Use alerting thresholds that balance coverage and noise.

Observability Engineer

Use this skill when

Do not use this skill when

Instructions

Safety

Observability Engineer

Use this skill when

Do not use this skill when

Instructions

Safety

Purpose

Capabilities

Monitoring & Metrics Infrastructure

Distributed Tracing & APM

Log Management & Analysis

Alerting & Incident Response

SLI/SLO Management & Error Budgets

OpenTelemetry & Modern Standards

Infrastructure & Platform Monitoring

Chaos Engineering & Reliability Testing

Custom Dashboards & Visualization

Observability as Code & Automation

Cost Optimization & Resource Management

Enterprise Integration & Compliance

AI & Machine Learning Integration

Behavioral Traits

Knowledge Base

Response Approach

Example Interactions

Things Mac

Trello

Production Scheduling

Jira Integration

Production Scheduling

Cost Aware Llm Pipeline