Skill ファイル

Aqua Metrics

Name: Aqua Metrics
Author: oracle

Set up Prometheus and Grafana monitoring for AQUA vLLM model deployments on OCI. Covers the signing proxy, container registry setup, OCI Container Instance deployment, and PromQL dashboards. Triggered when user wants to monitor LLM deployments, view TTFT/latency/throughput metrics, or set up observability for AQUA.

oracle124 スター2026/02/28

職業
カテゴリ: モニタリング

スキル内容

AQUA Deployment Metrics Monitoring

Monitor vLLM model deployments with Prometheus + Grafana hosted on an OCI Container Instance. The monitoring stack consists of:

Signing Proxy — handles OCI IAM auth when scraping the /metrics endpoint
Prometheus — scrapes metrics every 5s, stores time series
Grafana — visualizes dashboards from Prometheus data

Available Metrics (vLLM Prometheus)

All standard vLLM Prometheus metrics are available:

Metric	Description
`vllm:time_to_first_token_seconds`	TTFT histogram
`vllm:inter_token_latency_seconds`	ITL histogram
`vllm:e2e_request_latency_seconds`	End-to-end request latency
`vllm:num_requests_running`

関連 Skill

Aqua Metrics | Skills Pool

AQUA Model Deployment
  └── /predict/metrics endpoint (requires OCI IAM signature)
           ↑
    Signing Proxy :8080
    (resource_principal auth)
           ↑
    Prometheus :9090
    (scrapes localhost:8080 every 5s)
           ↑
    Grafana :3000
    (visualizes from localhost:9090)
           ↑
    User browser (public IP of Container Instance)

git clone https://github.com/oracle-samples/oci-data-science-ai-samples.git
cd oci-data-science-ai-samples/ai-quick-actions/aqua_metrics

cd signing_proxy
docker build --no-cache -t signing_proxy .
docker tag signing_proxy <registry-domain>/<tenancy-namespace>/signing_proxy
docker push <registry-domain>/<tenancy-namespace>/signing_proxy:latest

Aqua Metrics

AQUA Deployment Metrics Monitoring

Available Metrics (vLLM Prometheus)

Aqua Metrics

AQUA Deployment Metrics Monitoring

Available Metrics (vLLM Prometheus)

Architecture

Step 1: Clone the Monitoring Stack

Step 2: Build and Push Images to OCIR

Signing Proxy

Prometheus

Bluebubbles

Add Tracing

Analytics Events

Add Expert

Arthas

Arthas Eagleeye Traceid