Name: MedGemma HF Endpoint
Author: yaki6

스킬 검색.../

MedGemma HF Endpoint | Skills Pool

cp ~/.claude/skills/medgemma-endpoint/scripts/medgemma_client.py your_project/services/

import os
from your_project.services.medgemma_client import MedGemmaClient

client = MedGemmaClient(
    endpoint_url="https://pcmy7bkqtqesrrzd.us-east-1.aws.endpoints.huggingface.cloud",
    hf_token=os.environ["HF_TOKEN"],
)

# Health check
status = await client.health_check()

# Generate
result = await client.generate(
    messages=[
        {"role": "system", "content": "You are a medical assistant."},
        {"role": "user", "content": "Summarize this pathology report: ..."},
    ],
    max_tokens=2048,
)

# Parse JSON output (handles markdown-wrapped responses)
data = MedGemmaClient.parse_json(result)

<start_of_turn>user
[system prompt here]

[user message here]<end_of_turn>
<start_of_turn>model

client = MedGemmaClient(
    endpoint_url="...",
    hf_token="...",
    max_retries=6,
    retry_backoff=2.0,
    max_wait=60.0,
    cold_start_timeout=60.0,
)

MedGemma HF Endpoint

Endpoint

Critical Constraints

Quick Start

MedGemma HF Endpoint

Endpoint

Critical Constraints

Quick Start

Gemma Chat Template

Retry Configuration

Resources

Session Logs

OpenClaw Test Heap Leaks

Node Connect

Openclaw Qa Testing

Openclaw Secret Scanning Maintainer

Flags