스킬 파일

Dba Rds Slow Query

Name: Dba Rds Slow Query
Author: schoolofdevops

Investigate RDS PostgreSQL slow query performance using pg_stat_statements. Use when CloudWatch RDS CPUUtilization alarm fires, application reports slow queries, or pg_stat_statements shows queries with mean_time > 1000ms. Covers slow query identification, index gap analysis, parameter group review, and tuning recommendations.

schoolofdevops0 스타2026. 4. 4.

직업
카테고리: 디버깅

스킬 내용

When to Use

When CloudWatch alarm rds-cpu-high fires on RDS instance $RDS_INSTANCE_ID
When application monitoring shows database query p95 latency exceeding 2000ms
When pg_stat_statements report from a previous session shows mean_time > 1000ms for any query
When on-call alert: "RDS CPUUtilization > 80% sustained for 15 minutes"
NOT for: connection count issues (use separate connection-pool skill), replication lag, storage capacity

Inputs

Input	Source	Required	Description
RDS_INSTANCE_ID	$RDS_INSTANCE_ID env	YES	RDS instance identifier (e.g., prod-db-01)
AWS_DEFAULT_REGION	$AWS_DEFAULT_REGION env	YES	AWS region (e.g., us-east-1)
DB_HOST	$DB_HOST env	YES	RDS endpoint hostname (from `describe-db-instances`)

관련 스킬

Dba Rds Slow Query | Skills Pool

Tools: aws cli v2, psql (PostgreSQL client), or mock-aws / mock-psql for lab mode
Permissions: rds:DescribeDBInstances, rds:DescribeDBParameters, cloudwatch:GetMetricStatistics (read-only AWS); pg_read_all_stats role on target PostgreSQL database

Environment:

export RDS_INSTANCE_ID=prod-db-01
export AWS_DEFAULT_REGION=us-east-1
export DB_HOST=prod-db-01.c1234example.us-east-1.rds.amazonaws.com
export DB_NAME=appdb
export DB_USER=readonly_user

Lab mode: Set HERMES_LAB_MODE=mock and add course/infrastructure/wrappers/ to PATH for offline labs

aws rds describe-db-instances \
  --db-instance-identifier $RDS_INSTANCE_ID \
  --region $AWS_DEFAULT_REGION \
  --query 'DBInstances[0].{Status:DBInstanceStatus,Class:DBInstanceClass,Engine:EngineVersion,MultiAZ:MultiAZ,StorageType:StorageType}'

{
  "Status": "available",
  "Class": "db.t3.medium",
  "Engine": "15.4",
  "MultiAZ": false,
  "StorageType": "gp2"
}

{
  "Status": "maintenance",
  "Class": "db.t3.medium",
  "Engine": "15.4",
  "MultiAZ": false,
  "StorageType": "gp2"
}

aws cloudwatch get-metric-statistics \
  --namespace AWS/RDS \
  --metric-name CPUUtilization \
  --dimensions Name=DBInstanceIdentifier,Value=$RDS_INSTANCE_ID \
  --start-time $(date -u -v-30M +%Y-%m-%dT%H:%M:%SZ) \
  --end-time $(date -u +%Y-%m-%dT%H:%M:%SZ) \
  --period 300 \
  --statistics Average Maximum \
  --region $AWS_DEFAULT_REGION

aws cloudwatch get-metric-statistics \
  --namespace AWS/RDS \
  --metric-name DatabaseConnections \
  --dimensions Name=DBInstanceIdentifier,Value=$RDS_INSTANCE_ID \
  --start-time $(date -u -v-30M +%Y-%m-%dT%H:%M:%SZ) \
  --end-time $(date -u +%Y-%m-%dT%H:%M:%SZ) \
  --period 300 \
  --statistics Average Maximum \
  --region $AWS_DEFAULT_REGION

psql -h $DB_HOST -p ${DB_PORT:-5432} -U $DB_USER -d $DB_NAME -c "
SELECT
  round(mean_exec_time::numeric, 2) AS mean_time_ms,
  round(total_exec_time::numeric, 2) AS total_time_ms,
  calls,
  round((rows / calls)::numeric, 2) AS rows_per_call,
  query
FROM pg_stat_statements
WHERE calls > 10
ORDER BY mean_exec_time DESC
LIMIT 10;" -o /dev/stdout --csv

psql -h $DB_HOST -p ${DB_PORT:-5432} -U $DB_USER -d $DB_NAME -c "
SELECT
  schemaname,
  relname AS table_name,
  seq_scan,
  idx_scan,
  CASE WHEN (seq_scan + idx_scan) > 0
    THEN round(100.0 * seq_scan / (seq_scan + idx_scan), 2)
    ELSE 0
  END AS seq_scan_pct
FROM pg_stat_user_tables
WHERE seq_scan > 100
ORDER BY seq_scan_pct DESC
LIMIT 10;" -o /dev/stdout --csv

aws rds describe-db-parameters \
  --db-parameter-group-name $(aws rds describe-db-instances \
    --db-instance-identifier $RDS_INSTANCE_ID \
    --query 'DBInstances[0].DBParameterGroups[0].DBParameterGroupName' \
    --output text \
    --region $AWS_DEFAULT_REGION) \
  --region $AWS_DEFAULT_REGION \
  --query "Parameters[?ParameterName=='work_mem' || ParameterName=='shared_buffers' || ParameterName=='max_connections']"

Dba Rds Slow Query

When to Use

Inputs

Dba Rds Slow Query

When to Use

Inputs

Prerequisites

Procedure

Phase 1: Gather RDS and CloudWatch Data [SCRIPTS ZONE — deterministic]

Escalation Rules

NEVER DO

Rollback Procedure

Verification

Session Logs

OpenClaw Test Heap Leaks

Node Connect

Openclaw Qa Testing

Openclaw Secret Scanning Maintainer

Flags

Dba Rds Slow Query

When to Use

Inputs

Dba Rds Slow Query

When to Use

Inputs

Prerequisites

Procedure

Phase 1: Gather RDS and CloudWatch Data [SCRIPTS ZONE — deterministic]

Phase 2: Diagnose and Recommend [AGENTS ZONE — reasoning]

Escalation Rules

NEVER DO

Rollback Procedure

Verification

Session Logs

OpenClaw Test Heap Leaks

Node Connect

Openclaw Qa Testing

Openclaw Secret Scanning Maintainer

Flags