Name: Observability
Author: nebari-dev

スキルを検索.../

Observability | Skills Pool

kubectl config current-context
kubectl get ns

command -v pi-debug >/dev/null && echo "pi-debug available" || echo "pi-debug not available"

pi-debug doctor --app pi || true

kubectl get svc -A | grep -Ei 'grafana|loki|mimir|tempo|prometheus'

export GRAFANA_SVC="http://<grafana-svc>.<ns>.svc.cluster.local:80"
export LOKI_URL="http://<loki-svc>.<ns>.svc.cluster.local:3100"
export MIMIR_URL="http://<mimir-gateway-svc>.<ns>.svc.cluster.local"
export TEMPO_URL="http://<tempo-svc>.<ns>.svc.cluster.local:3200"
export PROM_URL="http://<prometheus-svc>.<ns>.svc.cluster.local:9090"

curl -fsS "${GRAFANA_SVC}/login" >/dev/null && echo grafana_ok
curl -fsS "${LOKI_URL}/ready" && echo
curl -fsS "${MIMIR_URL}/ready" && echo
curl -fsS "${PROM_URL}/-/ready" && echo

curl -sG "${LOKI_URL}/loki/api/v1/query_range" \
  --data-urlencode 'query={namespace="data-science"}' \
  --data-urlencode 'limit=200' \
  --data-urlencode 'direction=BACKWARD'

curl -sG "${LOKI_URL}/loki/api/v1/query_range" \
  --data-urlencode 'query={job=~".+"}' \
  --data-urlencode 'limit=200' \
  --data-urlencode 'direction=BACKWARD'

curl -sG "${LOKI_URL}/loki/api/v1/query_range" \
  --data-urlencode 'query={namespace="<ns>",pod=~"<pod-prefix>.*"}' \
  --data-urlencode 'limit=200' \
  --data-urlencode 'direction=BACKWARD'

pi-debug logs --app pi --since 30m
pi-debug events --app pi
pi-debug rollout --app pi
pi-debug doctor --app pi

kubectl get pods -A
kubectl get events -A --sort-by=.lastTimestamp | tail -n 120
kubectl get deploy -A

export GRAFANA_URL="https://<host>/monitoring"
curl -k -fsS "${GRAFANA_URL}/api/health"

kubectl get pods -A | grep -Ei 'grafana|loki|mimir|tempo|prometheus|otel'
kubectl get svc -A | grep -Ei 'grafana|loki|mimir|tempo|prometheus|otel'
kubectl logs -n monitoring ds/opentelemetry-collector-agent --tail=120 || true
kubectl get networkpolicy -A

Observability

Observability Skill (Nebari + Generic Kubernetes)

Core design awareness (important)

Access paths you must evaluate

Observability

Observability Skill (Nebari + Generic Kubernetes)

Core design awareness (important)

Access paths you must evaluate

Workflow

0) Detect environment + tools

1) Discover LGTM endpoints (do not hardcode)

2) Verify access fast (health checks)

3) Get logs for debugging (full-access mode)

Namespace-scoped logs

Broad logs across namespaces (when needed)

Pod-focused logs

4) Deployment failure triage checklist

5) Cloud/public route checks (optional)

6) Kubernetes diagnostics for broken observability path

Reporting format (required)

Reference

Bluebubbles

Add Tracing

Analytics Events

Add Expert

Arthas

Arthas Eagleeye Traceid