Name: Aiconfig Online Evals
Author: launchdarkly-labs

搵技能.../

Aiconfig Online Evals | Skills Pool

from ldclient import Context
from ldclient.config import Config
from ldai.client import LDAIClient, AICompletionConfigDefault
import ldclient

# Initialize (see aiconfig-sdk)
ldclient.set_config(Config("your-sdk-key"))
ld_client = ldclient.get()
ai_client = LDAIClient(ld_client)

def check_judges(ai_client, config_key: str, user_id: str):
    """Check which judges are attached to a config."""
    context = Context.builder(user_id).build()
    config = ai_client.completion_config(
        config_key,
        context,
        AICompletionConfigDefault(enabled=False),
        {}
    )

    if config.judge_configuration and config.judge_configuration.judges:
        print("[OK] Judges attached:")
        for judge in config.judge_configuration.judges:
            print(f"     - {judge.key}: {int(judge.sampling_rate * 100)}% sampling")
    else:
        print("[INFO] No judges configured")

    return config.judge_configuration

from ldai.client import AICompletionConfigDefault, ModelConfig, ProviderConfig, LDMessage

async def generate_with_automatic_evaluation(ai_client, config_key: str, user_id: str, prompt: str):
    """Generate AI response with automatic judge evaluation using create_chat."""
    context = Context.builder(user_id).build()

    chat = await ai_client.create_chat(
        config_key,
        context,
        AICompletionConfigDefault(
            enabled=True,
            model=ModelConfig("gpt-4"),
            provider=ProviderConfig("openai"),
            messages=[LDMessage(role='system', content='You are a helpful assistant.')]
        )
    )

    if not chat:
        return None

    # Invoke chat - judges evaluate automatically (1-2 min delay)
    response = await chat.invoke(prompt)

    # Results appear in Monitoring tab as:
    # $ld:ai:judge:accuracy, $ld:ai:judge:relevance, $ld:ai:judge:toxicity
    return response.message.content

Environment	Rate	Use Case
Development	100%	Full evaluation for testing
Staging	50%	Validation coverage
Production (initial)	10%	Start conservatively
Production (stable)	20%	Ongoing monitoring
Critical features	30%	Important flows

Aiconfig Online Evals

AI Config Online Evaluations

Prerequisites

Core Concepts

SDK: Check Judge Configuration

Aiconfig Online Evals

AI Config Online Evaluations

Prerequisites

Core Concepts

SDK: Check Judge Configuration

SDK: Automatic Evaluation with create_chat

Sampling Rate Guidelines

Viewing Results

Best Practices

References

Gemini

Feishu Wiki

Deep Research

Obsidian Vault Maintainer

Notion

Openai Whisper

Aiconfig Online Evals

AI Config Online Evaluations

Prerequisites

Core Concepts

SDK: Check Judge Configuration

Aiconfig Online Evals

AI Config Online Evaluations

Prerequisites

Core Concepts

SDK: Check Judge Configuration

SDK: Automatic Evaluation with create_chat

Sampling Rate Guidelines

Viewing Results

Best Practices

Related Skills

References

Gemini

Feishu Wiki

Deep Research

Obsidian Vault Maintainer

Notion

Openai Whisper