Name: Bio Clinical Biostatistics Subgroup Analysis
Author: GPTomics

Bio Clinical Biostatistics Subgroup Analysis | Skills Pool

from statsmodels.stats.contingency_tables import StratifiedTable
import pandas as pd
import numpy as np

tables = []
for stratum in df['subgroup'].unique():
    sub = df[df['subgroup'] == stratum]
    t = pd.crosstab(sub['treatment'], sub['outcome']).values
    if t.shape == (2, 2):
        tables.append(t)

st = StratifiedTable(tables)
print(st.summary())
print(st.oddsratio_pooled)              # MH pooled OR
print(st.oddsratio_pooled_confint())    # 95% CI
print(st.test_null_odds())              # H0: common OR = 1
print(st.test_equal_odds())             # Breslow-Day: H0: all stratum ORs equal

import statsmodels.formula.api as smf

# Single model with interaction -- the correct approach
model = smf.logit(
    'outcome ~ C(treatment, Treatment(reference="Placebo")) * C(age_group)', data=df
).fit()
# The interaction coefficient tests whether treatment effect differs by age group

# Extract subgroup-specific ORs for reporting
for group in df['age_group'].unique():
    sub_model = smf.logit(
        'outcome ~ C(treatment, Treatment(reference="Placebo"))',
        data=df[df['age_group'] == group]
    ).fit()
    or_val = np.exp(sub_model.params.iloc[1])
    ci = np.exp(sub_model.conf_int().iloc[1])
    print(f'{group}: OR={or_val:.3f} ({ci[0]:.3f}-{ci[1]:.3f})')

# From a model: outcome ~ treatment + subgroup_indicator + treatment:subgroup_indicator
# OR_11 = OR for treated subjects in the subgroup
# OR_10 = OR for treated subjects not in the subgroup
# OR_01 = OR for untreated subjects in the subgroup
reri = or_11 - or_10 - or_01 + 1

from statsmodels.stats.multitest import multipletests

subgroup_pvalues = [0.03, 0.15, 0.04, 0.22, 0.01]

# FWER control (appropriate for regulatory/confirmatory)
reject_fwer, adjusted_fwer, _, _ = multipletests(subgroup_pvalues, method='holm')

# FDR control (appropriate for exploratory)
reject_fdr, adjusted_fdr, _, _ = multipletests(subgroup_pvalues, method='fdr_bh')

Method	Controls	Use case
Holm (step-down Bonferroni)	FWER	Confirmatory/regulatory subgroup tests
Hochberg (step-up)	FWER	Less conservative than Holm; valid only under independence or positive regression dependency (PRDS)
Benjamini-Hochberg	FDR	Exploratory subgroup screening

Aspect	Pre-specified	Post-hoc
Timing	Before unblinding, in SAP	After seeing data
Credibility	High (if biologically justified)	Low (hypothesis-generating only)
Regulatory weight	Can support labeling claims	Cannot support claims alone
Multiplicity adjustment	Required per SAP	Required + heavy skepticism

import matplotlib.pyplot as plt
import numpy as np

def subgroup_forest_plot(labels, ors, lower_cis, upper_cis, overall_or=None, figsize=(8, 6)):
    fig, ax = plt.subplots(figsize=figsize)
    y_pos = range(len(labels))
    ax.errorbar(ors, y_pos,
                xerr=[np.array(ors) - np.array(lower_cis),
                      np.array(upper_cis) - np.array(ors)],
                fmt='D', color='black', capsize=3, markersize=5)
    ax.axvline(x=1.0, color='gray', linestyle='--', linewidth=0.8)
    if overall_or is not None:
        ax.axvline(x=overall_or, color='blue', linestyle=':', linewidth=0.8, alpha=0.5)
    ax.set_yticks(y_pos)
    ax.set_yticklabels(labels)
    ax.set_xlabel('Odds Ratio (95% CI)')
    ax.set_xscale('log')
    plt.tight_layout()
    return fig

Bio Clinical Biostatistics Subgroup Analysis

Version Compatibility

Subgroup Analysis

Mantel-Haenszel Stratified Analysis

Bio Clinical Biostatistics Subgroup Analysis

Version Compatibility

Subgroup Analysis

Mantel-Haenszel Stratified Analysis

Breslow-Day Test for Homogeneity

Interaction Terms in Regression

When to Suspect Effect Modification

Multiplicative vs Additive Interaction

Quantitative vs Qualitative Interaction

Power for Interaction Detection

Multiple Comparisons in Subgroup Analyses

Pre-Specified vs Post-Hoc Subgroups

Evaluating Biological Plausibility

Forest Plots for Subgroup Effects

Common Pitfalls

Visualization Expert

Data Analyst

Huggingface Hub

Multi Reviewer Patterns

Dbt Transformation Patterns

Startup Financial Modeling

Bio Clinical Biostatistics Subgroup Analysis

Version Compatibility

Subgroup Analysis

Mantel-Haenszel Stratified Analysis

Bio Clinical Biostatistics Subgroup Analysis

Version Compatibility

Subgroup Analysis

Mantel-Haenszel Stratified Analysis

Breslow-Day Test for Homogeneity

Interaction Terms in Regression

When to Suspect Effect Modification

Multiplicative vs Additive Interaction

Quantitative vs Qualitative Interaction

Power for Interaction Detection

Multiple Comparisons in Subgroup Analyses

Pre-Specified vs Post-Hoc Subgroups

Evaluating Biological Plausibility

Forest Plots for Subgroup Effects

Common Pitfalls

Related Skills

Visualization Expert

Data Analyst

Huggingface Hub

Multi Reviewer Patterns

Dbt Transformation Patterns

Startup Financial Modeling