Name: Ai
Author: villadalmine

Search skills.../

Ai | Skills Pool

┌─────────────────────────────────────────────────────────────┐
│                      Namespace: ai                          │
│                                                             │
│  ┌─────────────────┐    ┌──────────────────────────────┐   │
│  │  Hermes Agent   │───▶│  LiteLLM Proxy               │   │
│  │  model=free     │    │  port 4000                   │   │
│  │  OPENAI_API_BASE│    │  fallback: free→free2→cheap  │   │
│  └─────────────────┘    └─────────────┬────────────────┘   │
│                                       │ HTTPS:443           │
│                                       ▼                     │
│                               OpenRouter API                │
│                               (external)                    │
│  PVC: hermes-data (/opt/data)                               │
│  Secret: litellm-secrets (OPENROUTER_API_KEY)               │
│  Secret: hermes-secrets (OPENROUTER_API_KEY + bot tokens)   │
└─────────────────────────────────────────────────────────────┘

Namespace: registry
  registry:2 pod ← kaniko pushes here ← Kaniko job (namespace: kaniko)
  registries.yaml on K3s nodes → mirror registry.registry:5000 → ClusterIP

OPENAI_API_BASE=http://litellm-proxy.ai.svc.cluster.local:4000
OPENAI_API_KEY=sk-hermes-internal  (LiteLLM master key)
HERMES_MODEL=free

Virtual model	Real model	Provider
`free`	`openrouter/qwen/qwen3-coder:free`	coding-first free tier
`free2`	`openrouter/google/gemini-2.0-flash-exp:free`	Google free fallback
`cheap`	`openrouter/qwen/qwen-turbo`	reliable paid fallback
`strong`	`openrouter/deepseek/deepseek-chat-v3-0324`	best balance for hard tasks

make ai-registry

make ai-hermes-build        # hermes-agent (~60 min on CM4)
make ai-kubernetes-mcp-build  # kubernetes-mcp-server sidecar (~1 min)
# Monitor with:
kubectl get jobs -n kaniko
kubectl logs -n kaniko job/build-hermes-arm64 -f | grep -v "npm WARN"
kubectl logs -n kaniko job/build-kubernetes-mcp-server-arm64 -f

make ai-hermes-deploy

make ai  # registry + hermes-build + kubernetes-mcp-build + hermes-deploy (~70 min total)

hermes_openrouter_api_key: "sk-or-v1-..."
hermes_telegram_token: ""   # optional
hermes_discord_token: ""    # optional

hermes_model: "free"    # default — uses LiteLLM fallback chain
hermes_model: "cheap"   # skip free tiers entirely

# Hermes web UI (requires ingress stack)

Component	Image	Version	Namespace	Notes
Docker registry	`registry:2`	2	registry	ARM64-compatible image storage (5Gi PVC)
LiteLLM proxy	`ghcr.io/berriai/litellm`	main-latest	ai	In-cluster OpenRouter router with fallbacks
Hermes Agent	`registry.registry:5000/ai/hermes-agent`	0.7.0	ai	Gateway mode + Telegram polling + MCP sidecar
kubernetes-mcp-server	`registry.registry:5000/ai/kubernetes-mcp-server`	v0.0.60	ai (sidecar)	K8s read-only MCP server sidecar in Hermes pod
HolmesGPT	`robusta/holmes` (Helm)

Component	Image	Version	Namespace	Notes
Docker registry	`registry:2`	2	registry	ARM64-compatible image storage (5Gi PVC)
LiteLLM proxy	`ghcr.io/berriai/litellm`	main-latest	ai	In-cluster OpenRouter router with fallbacks
Hermes Agent	`registry.registry:5000/ai/hermes-agent`	0.7.0	ai	Gateway mode + Telegram polling + MCP sidecar
kubernetes-mcp-server	`registry.registry:5000/ai/kubernetes-mcp-server`	v0.0.60	ai (sidecar)	K8s read-only MCP server sidecar in Hermes pod
HolmesGPT	`robusta/holmes` (Helm)

Component	CPU req	CPU limit	Mem req	Mem limit
LiteLLM proxy	100m	500m	128Mi	512Mi
Hermes Agent	100m	500m	128Mi	512Mi

Ai

AI Agent Skill

Stack Overview

Ai

AI Agent Skill

Stack Overview

Architecture

Why Custom Build?

LiteLLM Proxy — Model Routing

Hermes MCP lessons learned

LiteLLM Metrics & Grafana Dashboard

Installation

Step 1: Install registry (fast)

Step 2: Build ARM64 images (60 min + 1 min)

Step 3: Deploy LiteLLM proxy + Hermes (2 min)

All at once

Configuration

API key (required)

Change default model tier

Resources (CM4-friendly defaults)

Access

Helm Chart Scaffolding

Python Observability

K8s Manifest Generator

Istio Traffic Management

Secrets Management

Gitops Workflow