Name: Llm Tracing
Author: ingli96

スキルを検索.../

Llm Tracing | Skills Pool

from langfuse import observe, get_client
from langfuse.openai import AsyncOpenAI  # Wrapped client - auto-captures everything

langfuse = get_client()
client = AsyncOpenAI()

async def summarize(text: str) -> str:
    response = await client.responses.create(
        model="gpt-5.4-mini",
        input=f"Summarize this text:\n\n{text}",
    )
    return response.output_text

langfuse.flush()  # Always flush before process exits

from langfuse import get_client, propagate_attributes
from openai import AsyncOpenAI  # Regular client (not wrapped)

langfuse = get_client()
client = AsyncOpenAI()

async def chat(prompt: str, user_id: str) -> str:
    # v4: use start_as_current_observation + propagate_attributes
    with langfuse.start_as_current_observation(as_type="generation", name="openai-chat") as obs:
        with propagate_attributes(
            user_id=user_id,
            session_id="session_abc",
            metadata={"source": "api"},
        ):
            response = await client.responses.create(
                model="gpt-5.4-mini",
                input=prompt,
            )

            obs.update(
                input=prompt,
                output=response.output_text,
                metadata={
                    "input_tokens": str(response.usage.input_tokens),
                    "output_tokens": str(response.usage.output_tokens),
                },
            )
            return response.output_text

langfuse.flush()

from dotenv import load_dotenv
load_dotenv()

from langfuse import observe, get_client, propagate_attributes
langfuse = get_client()

# Auto-instrument BOTH SDKs - one line each
from openinference.instrumentation.openai import OpenAIInstrumentor
from openinference.instrumentation.google_genai import GoogleGenAIInstrumentor

OpenAIInstrumentor().instrument()
GoogleGenAIInstrumentor().instrument()

# Use native clients (NOT wrapped versions)
from openai import AsyncOpenAI
from google import genai

openai_client = AsyncOpenAI()
google_client = genai.Client(api_key=os.environ.get("GEMINI_API_KEY"))

@observe(name="my-pipeline")  # Parent span groups child LLM calls
async def run_pipeline(user_id: str):
    with propagate_attributes(user_id=user_id, session_id="session_abc"):
        # Both calls auto-traced as children, attributes propagated
        await openai_client.responses.create(...)
        google_client.models.generate_content(...)

langfuse.flush()  # Always flush before exit

Topic	Details
SDK Version	v4.0.0+ (OpenTelemetry-based internally)
Imports	`from langfuse import observe, get_client, propagate_attributes`
Client	`get_client()` returns singleton
Decorator	`@observe(as_type="generation", name="...")` - easiest way to trace functions
Context manager	`langfuse.start_as_current_observation(as_type="generation", name="...")` - inline control
Attributes	`propagate_attributes(user_id=..., session_id=..., metadata=...)` - replaces `update_current_trace()`
Metadata	`dict[str, str]` - values max 200 chars, non-string coerced
Langfuse OpenAI wrapper	`from langfuse.openai import AsyncOpenAI` - auto-captures model, tokens, I/O
OpenTelemetry	`openinference-instrumentation-*` packages auto-connect to Langfuse's internal OTEL setup
Pydantic	Requires Pydantic v2 (use `pydantic.v1` shim if needed)
Flush	`langfuse.flush()` - required before process exits
Environment	`LANGFUSE_PUBLIC_KEY`, `LANGFUSE_SECRET_KEY`, `LANGFUSE_HOST` (not `_BASE_URL`)

// instrumentation.ts - import this FIRST in your app entry point
import { NodeSDK } from "@opentelemetry/sdk-node";
import { LangfuseSpanProcessor } from "@langfuse/otel";

export const langfuseSpanProcessor = new LangfuseSpanProcessor();

export const sdk = new NodeSDK({
  spanProcessors: [langfuseSpanProcessor],
});

sdk.start();

import "./instrumentation"; // Must be first!
import OpenAI from "openai";
import { observeOpenAI } from "@langfuse/openai";

const openai = observeOpenAI(new OpenAI());

async function main() {
  // Automatically traced - captures latency, tokens, errors
  const response = await openai.responses.create({
    model: "gpt-5.4-mini",
    input: "Hello!",
  });

  console.log(response.output_text);
}

main();

import "./instrumentation";
import { observe, startActiveObservation, startObservation } from "@langfuse/tracing";
import OpenAI from "openai";

const openai = new OpenAI();

// Option 1: observe wrapper (simplest for wrapping functions)
const fetchData = observe(
  async (source: string) => {
    const response = await openai.responses.create({
      model: "gpt-5.4-mini",
      input: `Fetch data from ${source}`,
    });
    return response.output_text;
  },
  { name: "fetch-data", asType: "generation" }
);

// Option 2: startActiveObservation (nested spans with context)
async function processRequest(userId: string, query: string) {
  return await startActiveObservation("process-request", async (span) => {
    span.update({ input: { userId, query }, metadata: { source: "api" } });

    // Nested generation - automatically linked to parent span
    const generation = startObservation(
      "llm-call",
      { model: "gpt-5.4-mini", input: query },
      { asType: "generation" }
    );

    try {
      const response = await openai.responses.create({
        model: "gpt-5.4-mini",
        input: query,
      });

      const result = response.output_text;
      generation.update({
        output: { content: result },
        usageDetails: {
          input: response.usage?.input_tokens ?? 0,
          output: response.usage?.output_tokens ?? 0,
        },
      }).end();

      span.update({ output: { result } });
      return result;
    } catch (error) {
      generation.update({
        output: { error: error instanceof Error ? error.message : "Failed" },
      }).end();
      throw error;
    }
  });
}

Topic	Details
SDK Version	v4+ (OpenTelemetry-based)
Packages	`@langfuse/tracing`, `@langfuse/otel`, `@opentelemetry/sdk-node`
OpenAI wrapper	`@langfuse/openai` with `observeOpenAI(new OpenAI())`
Setup	Must initialize `NodeSDK` with `LangfuseSpanProcessor` before tracing
Tracing	`observe()`, `startActiveObservation()`, `startObservation()` from `@langfuse/tracing`
Token usage	`usageDetails: { input: N, output: M }` in `update()`
Flush	`langfuseSpanProcessor.forceFlush()` or `sdk.shutdown()`
Environment	`LANGFUSE_PUBLIC_KEY`, `LANGFUSE_SECRET_KEY`, `LANGFUSE_BASE_URL` (not `_HOST`)

Aspect	Long-running server	Serverless
Flush timing	End of process / periodic	Every request before response
SDK init	Once at startup	Module scope (reused across warm invocations)
Flush method	`flush()` (fire-and-forget OK)	`await flush()` or `forceFlush()` (must await)

from langfuse import observe, get_client, propagate_attributes
from langfuse.openai import AsyncOpenAI
import os

# Module scope: initialized once, reused across warm invocations
langfuse = get_client()
client = AsyncOpenAI()

@observe(name="handle-request")
async def handle_request(prompt: str, user_id: str):
    if not os.getenv("LANGFUSE_PUBLIC_KEY"):
        return  # Tracing disabled

    with propagate_attributes(user_id=user_id):
        response = await client.responses.create(
            model="gpt-5.4-mini",
            input=prompt,
        )

    # SERVERLESS DIFFERENCE: Must flush BEFORE returning response
    # In a regular server, you might flush periodically or at shutdown
    # In serverless, the function may be killed immediately after return
    langfuse.flush()
    return response.output_text

// instrumentation.ts - runs once at cold start, reused on warm invocations
import { NodeSDK } from "@opentelemetry/sdk-node";
import { LangfuseSpanProcessor } from "@langfuse/otel";

export const langfuseSpanProcessor = new LangfuseSpanProcessor();
export const sdk = new NodeSDK({ spanProcessors: [langfuseSpanProcessor] });
sdk.start();

// route.ts - API handler
import { langfuseSpanProcessor } from "./instrumentation";
import { startActiveObservation } from "@langfuse/tracing";

export async function POST(request: Request) {
  return await startActiveObservation("api-request", async (span) => {
    span.update({ input: { path: "/api/process" } });

    // ... do LLM calls with tracing ...

    span.update({ output: { success: true } });

    // SERVERLESS DIFFERENCE: Must await forceFlush() before returning
    // Unlike long-running servers where background sends complete eventually,
    // serverless functions can be frozen/killed immediately after response
    await langfuseSpanProcessor.forceFlush();

    return Response.json({ success: true });
  });
}

# Python SDK v4 - @observe decorator (easiest) or start_as_current_observation (manual)
from langfuse import observe, get_client

# Decorator style (recommended):
@observe(as_type="generation", name="llm-call")  # LLM model calls (most common)
async def call_llm(): ...

@observe(name="fetch-context")  # Span - any operation (default type)
async def fetch_context(): ...

@observe(as_type="event", name="cache-hit")  # Event - point-in-time markers
def log_cache_hit(): ...

# Context manager style (when you need inline control):
langfuse = get_client()
with langfuse.start_as_current_observation(as_type="generation", name="llm-call") as obs:
    obs.update(input="...", output="...")

// TypeScript SDK v4
import { startObservation, observe } from "@langfuse/tracing";

// Generation - LLM model calls (most common)
const gen = startObservation("llm-call", { model: "gpt-5.4-mini" }, { asType: "generation" });
gen.update({ output: { content: "..." }, usageDetails: { input: 10, output: 5 } }).end();

// Span - any operation (default type)
const span = startObservation("fetch-context", { input: { query: "..." } });
span.update({ output: { result: "..." } }).end();

// Tool - external tool/function calls
const tool = startObservation("search", { input: { q: "..." } }, { asType: "tool" });
tool.update({ output: { results: [...] } }).end();

# Python SDK v4 - @observe decorator still works, use get_client() for updates
from langfuse import observe, get_client

langfuse = get_client()

@observe(as_type="generation", name="llm-call")
async def call_llm():
    try:
        # ... LLM call ...
        langfuse.update_current_observation(level="DEFAULT")  # Success
    except Exception:
        langfuse.update_current_observation(level="ERROR")    # Failure
        raise

# v4: metadata values must be dict[str, str] (max 200 chars per value)
langfuse.update_current_observation(
    input=prompt,
    output=response.output_text,
    metadata={
        "input_tokens": str(response.usage.input_tokens),
        "output_tokens": str(response.usage.output_tokens),
        "total_tokens": str(response.usage.input_tokens + response.usage.output_tokens),
    },
)

# Python SDK v4
from langfuse import get_client

langfuse = get_client()
langfuse.flush()  # Required before process exits

// TypeScript SDK v4
import { langfuseSpanProcessor, sdk } from "./instrumentation";

// Option 1: Force flush (keeps SDK running - use in serverless)
await langfuseSpanProcessor.forceFlush();

// Option 2: Full shutdown (flushes and stops SDK - use for CLI tools)
await sdk.shutdown();
```38:["$","$L3f",null,{"content":"$40","frontMatter":{"name":"llm-tracing","description":"Use when task involves LLM observability, tracing, Langfuse, OpenTelemetry for AI, monitoring LLM calls, or debugging AI pipelines. Load BEFORE planning or writing code."}}]

Llm Tracing

LLM Tracing with Langfuse (March 2026)

Installation

Environment Variables

Llm Tracing

LLM Tracing with Langfuse (March 2026)

Installation

Environment Variables

Python: Choosing an Instrumentation Approach

Python Option 1: Langfuse OpenAI Wrapper (Simplest)

Python Option 2: Manual Tracing (Full Control)

Python Option 3: OpenTelemetry Auto-Instrumentation (Multi-Provider)

Python SDK v4 Key Points

TypeScript: Instrumentation Options

TypeScript: OpenTelemetry Setup (Required)

TypeScript: Wrapped OpenAI Client (Recommended)

TypeScript: Manual Tracing

TypeScript SDK v4 Key Points

Serverless: Singleton Pattern

Python

TypeScript

Observation Types

Status Levels (Python)

Capturing Token Usage

Privacy Best Practices

Flush: Critical for Serverless

Bluebubbles

Add Tracing

Analytics Events

Add Expert

Arthas

Arthas Eagleeye Traceid