Name: Statistical Analysis
Author: Hollis36

Statistical Analysis

统计分析与报告助手，帮助科研人员进行正确的统计检验和结果报告。支持Python (scipy/statsmodels/pingouin)和R统计分析、功效分析和样本量计算、APA/AMA统计报告规范、常见统计陷阱避免(p-hacking/多重比较)。当用户需要：(1) 选择合适的统计检验方法、(2) 进行数据统计分析、(3) 计算样本量和功效、(4) 按规范报告统计结果时触发。关键词：统计检验、t检验、ANOVA、回归分析、样本量计算、统计报告。

Hollis361 스타2026. 4. 6.

직업
카테고리: 데이터 분석

统计分析与报告助手

帮助科研人员选择合适的统计方法、正确进行分析、避免常见陷阱、规范报告结果。

核心功能

1. 统计方法选择指南

2. Python 和 R 统计分析工作流

3. 功效分析和样本量计算

4. 统计报告规范（APA/AMA）

5. 常见统计陷阱避免

统计方法选择流程图

开始
  │
  ├─ 数据类型？
  │   ├─ 连续型 → 是否满足正态分布？
  │   │              ├─ 是 → 几组比较？
  │   │              │      ├─ 2组 → 独立/配对？
  │   │              │      │      ├─ 独立 → t检验
  │   │              │      │      └─ 配对 → 配对t检验
  │   │              │      └─ 3组+ → ANOVA → 事后检验
  │   │              └─ 否 → 几组比较？
  │   │                     ├─ 2组 → Mann-Whitney U / Wilcoxon
  │   │                     └─ 3组+ → Kruskal-Wallis → Dunn检验
  │   │
  │   ├─ 分类型 → 几组比较？
  │   │            ├─ 2组 → 卡方检验 / Fisher精确检验
  │   │            └─ 3组+ → 卡方检验
  │   │
  │   └─ 相关性分析 → 数据类型？
  │                    ├─ 连续+正态 → Pearson相关
  │                    ├─ 连续+非正态 → Spearman相关
  │                    └─ 分类+分类 → 卡方检验

Statistical Analysis

Hollis361 스타2026. 4. 6.

직업
카테고리: 데이터 분석

统计方法选择流程图

开始 │ ├─ 数据类型？ │ ├─ 连续型 → 是否满足正态分布？ │ │ ├─ 是 → 几组比较？ │ │ │ ├─ 2组 → 独立/配对？ │ │ │ │ ├─ 独立 → t检验 │ │ │ │ └─ 配对 → 配对t检验 │ │ │ └─ 3组+ → ANOVA → 事后检验 │ │ └─ 否 → 几组比较？ │ │ ├─ 2组 → Mann-Whitney U / Wilcoxon │ │ └─ 3组+ → Kruskal-Wallis → Dunn检验 │ │ │ ├─ 分类型 → 几组比较？ │ │ ├─ 2组 → 卡方检验 / Fisher精确检验 │ │ └─ 3组+ → 卡方检验 │ │ │ └─ 相关性分析 → 数据类型？ │ ├─ 连续+正态 → Pearson相关 │ ├─ 连续+非正态 → Spearman相关 │ └─ 分类+分类 → 卡方检验

from statsmodels.stats.power import TTestIndPower, FTestAnovaPower import matplotlib.pyplot as plt import numpy as np # t检验功效分析 analysis = TTestIndPower() # 1. 计算样本量（给定效应量、功效、显著性水平） effect_size = 0.5 # Cohen's d alpha = 0.05 # 显著性水平 power = 0.80 # 统计功效 sample_size = analysis.solve_power(effect_size=effect_size, alpha=alpha, power=power, alternative='two-sided') print(f"每组所需样本量: {np.ceil(sample_size):.0f}") # 2. 计算功效（给定样本量、效应量） actual_power = analysis.solve_power(effect_size=effect_size, nobs1=30, alpha=alpha, alternative='two-sided') print(f"实际统计功效: {actual_power:.4f}") # 3. 计算可检测的最小效应量（给定样本量、功效） min_effect = analysis.solve_power(nobs1=30, alpha=alpha, power=power, alternative='two-sided') print(f"可检测的最小效应量: {min_effect:.4f}") # 4. 绘制功效曲线 effect_sizes = np.arange(0.1, 1.5, 0.1) sample_sizes = [analysis.solve_power(effect_size=es, alpha=alpha, power=power) for es in effect_sizes] plt.figure(figsize=(8, 6)) plt.plot(effect_sizes, sample_sizes) plt.xlabel('Effect Size (Cohen\'s d)') plt.ylabel('Sample Size per Group') plt.title('Sample Size vs Effect Size (Power = 0.80, α = 0.05)') plt.grid(True) plt.savefig('power_analysis.png', dpi=300) # ANOVA功效分析 anova_analysis = FTestAnovaPower() k = 3 # 组数 sample_size_anova = anova_analysis.solve_power(effect_size=0.25, alpha=0.05, power=0.80, k_groups=k) print(f"\nANOVA每组所需样本量: {np.ceil(sample_size_anova):.0f}")

库	主要功能	推荐用途
scipy.stats	基础统计检验	快速简单分析
statsmodels	回归、时间序列	详细统计建模
pingouin	全面统计分析	效应量、功效分析
scikit-posthocs	事后检验	多重比较
numpy	数值计算	数据处理
pandas	数据框架	数据组织

包	主要功能
stats	基础统计（内置）
car	回归诊断、ANOVA
pwr	功效分析
effsize	效应量计算
lsr	学习统计基础

Statistical Analysis

统计分析与报告助手

核心功能

1. 统计方法选择指南

2. Python 和 R 统计分析工作流

3. 功效分析和样本量计算

4. 统计报告规范（APA/AMA）

5. 常见统计陷阱避免

统计方法选择流程图

Statistical Analysis

统计分析与报告助手

核心功能

1. 统计方法选择指南

2. Python 和 R 统计分析工作流

3. 功效分析和样本量计算

4. 统计报告规范（APA/AMA）

5. 常见统计陷阱避免

统计方法选择流程图

常用统计检验

1. t检验（Independent/Paired t-test）

Python实现

R实现

2. 方差分析（ANOVA）

Python实现

R实现

3. 非参数检验

Mann-Whitney U 检验（两独立样本）

Wilcoxon符号秩检验（两配对样本）

Kruskal-Wallis检验（多组独立样本）

4. 卡方检验

5. 相关分析

6. 线性回归

功效分析和样本量计算

Python实现（statsmodels）

R实现（pwr包）

统计报告规范

APA 第7版格式

描述性统计

t检验

ANOVA

卡方检验

相关

回归

报告检查清单

常见统计陷阱及避免方法

1. p-Hacking（p值操纵）

2. 多重比较问题

3. 样本量不足

4. 假设违反

5. 伪相关（Spurious Correlation）

6. 基线不平衡

Python常用统计库总结

R常用统计包总结

参考资源

Visualization Expert

Data Analyst

Huggingface Hub

Multi Reviewer Patterns

Dbt Transformation Patterns

Startup Financial Modeling