Name: Coreweave Hello World
Author: jeremylongshore

Overview

Deploy your first GPU workload on CoreWeave: a simple inference service using vLLM or a batch CUDA job. CoreWeave runs Kubernetes on bare-metal GPU nodes with A100, H100, and L40 GPUs.

Prerequisites

Completed coreweave-install-auth setup
kubectl configured with CoreWeave kubeconfig
Namespace with GPU quota

Instructions

Step 1: Deploy a vLLM Inference Server

# vllm-inference.yaml
apiVersion: apps/v1

Coreweave Hello World

Overview

Prerequisites

Instructions

Step 1: Deploy a vLLM Inference Server

Coreweave Hello World

Overview

Prerequisites

Instructions

Step 1: Deploy a vLLM Inference Server

Helm Chart Scaffolding

Python Observability

K8s Manifest Generator

Istio Traffic Management

Secrets Management

Gitops Workflow