Name: Bayesian Inference
Author: kantundpeterpan

Bayesian Inference | Skills Pool

import pymc as pm
import numpy as np
import matplotlib.pyplot as plt

with pm.Model() as model:
    alpha = pm.Normal("alpha", mu=0, sigma=10)
    beta = pm.Normal("beta", mu=0, sigma=2, shape=2)
    sigma = pm.HalfNormal("sigma", sigma=5)

    mu = alpha + beta[0] * X[:, 0] + beta[1] * X[:, 1]
    y_obs = pm.Normal("y_obs", mu=mu, sigma=sigma, observed=y)

    # Prior predictive check
    prior_pred = pm.sample_prior_predictive(samples=200)

fig, ax = plt.subplots()
ax.hist(prior_pred.prior_predictive["y_obs"].values.flatten(), bins=50)
ax.set_title("Prior predictive distribution"); ax.set_xlabel("y")
fig.savefig("figures/bayes_prior_predictive.png", dpi=150)

with model:
    trace = pm.sample(
        draws=2000,
        tune=1000,
        chains=4,
        cores=4,
        random_seed=42,
        target_accept=0.9,
    )

import arviz as az

# Numerical convergence diagnostics
summary = az.summary(trace, var_names=["alpha", "beta", "sigma"])
print(summary)
# R-hat < 1.01 and ESS_bulk > 400 required

# Trace plots
az.plot_trace(trace, var_names=["alpha", "beta", "sigma"])
plt.savefig("figures/bayes_trace.png", dpi=150)

# Energy plot
az.plot_energy(trace)
plt.savefig("figures/bayes_energy.png", dpi=150)

# Rank plots (MCMC mixing diagnostic)
az.plot_rank(trace, var_names=["alpha", "beta"])
plt.savefig("figures/bayes_rank.png", dpi=150)

# Posterior distribution plot
az.plot_posterior(trace, var_names=["beta"], hdi_prob=0.94)
plt.savefig("figures/bayes_posterior.png", dpi=150)

print(az.summary(trace, var_names=["beta"], hdi_prob=0.94))

with model:
    ppc = pm.sample_posterior_predictive(trace)

az.plot_ppc(az.from_pymc(posterior_predictive=ppc, model=model))
plt.savefig("figures/bayes_ppc.png", dpi=150)

We specified a Bayesian linear regression with weakly informative priors
($\alpha \sim \mathcal{N}(0, 10)$, $\beta \sim \mathcal{N}(0, 2)$,
$\sigma \sim \text{HalfNormal}(5)$).
Posterior sampling used NUTS (4 chains × 2,000 draws; 1,000 warm-up).
All parameters converged ($\hat{R} < 1.01$; $\text{ESS}_\text{bulk} > 800$).

$\beta_1$ had a posterior mean of 0.43 (94% HDI: [0.28, 0.58]), providing
strong evidence of a positive association with the outcome.

Bayesian Inference

When to Use

Workflow

1. State the Generative Model

2. Elicit Priors

Bayesian Inference

When to Use

Workflow

1. State the Generative Model

2. Elicit Priors

3. Sample the Posterior

4. Diagnose Convergence

5. Posterior Summary

6. Posterior Predictive Check

7. Report Results

Review Checklist

Continuous Learning V2

Continuous Learning V2

Continuous Learning V2

Continuous Learning

Continuous Learning

Pytorch Patterns