SBC Validation and Calibration Diagnostics

Core Idea

Simulation-Based Calibration (SBC) validates neural posterior estimators by checking that credible intervals achieve their nominal coverage. A well- calibrated model's HPD ranks should be uniformly distributed.

Condition Grid Validation

Test the model across its full design space, not just training conditions:

from bayesflow_hpo import make_condition_grid

# Factorial grid of experimental conditions
conditions = make_condition_grid(
    n_total=[50, 100, 200, 500],
    effect_size=[0.1, 0.3, 0.5, 0.8],
    allocation_ratio=[0.3, 0.5, 0.7],
)
# Returns list of condition dicts, one per grid point (4 * 4 * 3 = 48)

For strict validation (IRT / RCT pattern):

SBC Validation and Calibration Diagnostics

Core Idea

Condition Grid Validation

Test the model across its full design space, not just training conditions:

from bayesflow_hpo import make_condition_grid

# Factorial grid of experimental conditions
conditions = make_condition_grid(
    n_total=[50, 100, 200, 500],
    effect_size=[0.1, 0.3, 0.5, 0.8],
    allocation_ratio=[0.3, 0.5, 0.7],
)
# Returns list of condition dicts, one per grid point (4 * 4 * 3 = 48)

For strict validation (IRT / RCT pattern):

Metric	What it measures	Good value
Calibration error	Deviation of rank distribution from uniform	< 0.02
C2ST deviation	Classifier two-sample test (ranks vs uniform)	< 0.52
Coverage error @ 90%		observed coverage - 0.90
Coverage error @ 95%		observed coverage - 0.95

Bayesflow Validation

SBC Validation and Calibration Diagnostics

Core Idea

Condition Grid Validation

Bayesflow Validation

SBC Validation and Calibration Diagnostics

Core Idea

Condition Grid Validation

Validation Dataset (Pre-compute and Cache)

Coverage Metrics

Validation Pipeline

Continuous Learning V2

Continuous Learning V2

Continuous Learning V2

Continuous Learning

Continuous Learning

Pytorch Patterns