植物根长度数据的自动化统计分析,包含方差分析(ANOVA)、Tukey HSD多重比较和出版级可视化。 当用户提到:根长度、植物表型、处理组比较(Mock vs ISX)、R语言ANOVA分析,或提供包含 sample/treatment/length列的CSV/Excel数据时使用。也适用于生物统计和科学绘图。
使用 dataset_catalog、run_r_code、code_session、chart_session 和 report_session,对植物根长度数据进行专业的统计分析、可视化与结果整理。
本技能帮助生物学研究者通过简单的3步工作流程分析根长度数据:
最低要求:
sample(样本)、treatment(处理)、length(长度)您将获得:
示例对话:
用户:"我有根长度数据需要分析"
Claude:"我来帮您分析根长度数据。请提供CSV或Excel文件的路径。"
用户:"C:/data/roots_2024.csv"
Claude:[验证数据,询问颜色方案,生成分析]
结果:5分钟内得到专业图表和统计结果
不再限于Mock vs ISX两组比较!现在支持:
示例:
处理组:Mock, ISX, Treatment3, Treatment4
基线:Mock(默认)或任意其他组
结果:4个分面的图表 + 多组比率分析
一次性分析多个实验数据!
使用场景:
无需安装R环境!现在支持纯Python模式:
适用场景:
如何使用:
# 生成Python项目(而非R项目)
python scripts/generate_r_project.py --data-file data.csv --use-python
# 批量分析使用Python模式
python scripts/batch_analysis.py --files *.csv --use-python
您的数据文件必须包含3列(列名区分大小写):
| 列名 | 类型 | 说明 | 示例值 |
|---|---|---|---|
sample | 文本 | 样本或基因型名称 | Col_0, mutant1, Aox1a OE |
treatment | 文本 | 处理组(必须包含"Mock") | Mock, ISX |
length | 数值 | 根长度测量值 | 5.23, 4.1, 3.87 |
✅ 必须满足:
sample、treatment、length(小写)Mock(大写M)❌ 常见错误:
sample,treatment,length
Col_0,Mock,5.2
Col_0,Mock,5.4
Col_0,Mock,5.1
Col_0,ISX,4.1
Col_0,ISX,4.3
Col_0,ISX,4.2
mutant1,Mock,3.8
mutant1,Mock,4.0
mutant1,Mock,3.9
mutant1,ISX,5.2
mutant1,ISX,5.4
mutant1,ISX,5.1
详细格式说明见:references/data_format.md
当您调用此技能时,我将引导您完成以下步骤:
我会询问您的数据文件路径。
支持格式:CSV (.csv)、Excel (.xlsx, .xls)
我会使用验证脚本自动检查您的数据:
python scripts/validate_data.py <您的文件>
验证项目:
如果验证失败:我会提供清晰的错误信息和具体修复建议。
如果验证成功:我会显示数据摘要:
{
"n_samples": 9,
"treatments": ["Mock", "ISX"],
"n_measurements": 450,
"length_range": {"min": 3.0, "max": 5.5, "mean": 4.4}
}
我会使用 ask_user_question 工具询问分析参数:
问题1:颜色方案
选项:
high_contrast(推荐)- 24种高对比度颜色,视觉最清晰default - 32种多样化颜色,适合大样本集blue - 蓝色渐变(5-16个样本)green - 绿色渐变,植物主题qualitative - 平衡的分类颜色问题2:样本排序
选项:
auto(推荐)- Col_0优先,然后非OE样本,最后OE样本custom - 自定义排序(我会询问具体顺序)我会创建完整的R分析项目:
python scripts/generate_r_project.py \
--data-file <您的文件> \
--color-scheme <选择> \
--sample-order <auto或custom> \
--output-dir output \
--width 8 \
--height 6
输出结构:
r_analysis_project/
├── main.R
├── R/
│ ├── load_packages.R
│ ├── data_processing.R
│ ├── statistical_analysis.R
│ └── plotting.R
└── output/
├── figures/
└── records/
我会运行R分析:
cd r_analysis_project && Rscript main.R
处理过程:
我会向您展示:
统计摘要:
=== ANOVA结果(Mock组)===
F统计量:12.4,p < 0.001
样本间存在显著差异
=== ANOVA结果(ISX组)===
F统计量:8.7,p < 0.001
样本间存在显著差异
生成的文件:
output/figures/root_length_plot.pdf - 主图表,带显著性字母output/figures/ratio_plot.pdf - ISX/Mock比率比较output/records/sample_order.txt - 使用的样本排序output/records/color_mapping.csv - 颜色分配可选:我可以解释统计结果、显著性字母或分析的任何方面。
单因素方差分析检验每个处理组内不同样本的平均根长度是否存在差异。
关键数值:
示例:
处理组:Mock
F(8, 216) = 12.43,p < 0.001
解读:在8个样本和216次测量中,我们发现强有力的证据(p < 0.001)表明样本的Mock根长度存在差异。
ANOVA检测到差异后,Tukey HSD识别具体哪些配对存在差异。
结果以字母显示(a、b、c等):
规则:共享字母的组 → 无显著差异
示例1:
Col_0: a