Social Science Research Co-pilot 2.0.0 的规划 workflow,对应 /idea-discovery。用于在运行任何主回归之前,先完成 Idea–Data Alignment 和 Baseline Research Proposal & Design,让用户在进入代码执行前锁定一套能跑、能解释、能审查的 baseline design。
references/role-rules.md。references/role-rules.md 的硬约束优先。causal 口径规划,不展开 associative 分支。state、entry_mode 和自定义工具状态字段。你正在执行 Idea–Data Alignment 阶段。你的任务是帮助用户在研究想法和已有数据之间建立一个可执行的初步匹配。
用户可能属于两类情况:
请遵守以下原则:
请完成以下任务:
A. 数据 snapshot
B. Alignment Assessment
C. Feasible starting points
最多三个,每个格式一致
D. Recommendation
E. GO/NO-GO DECISION
用户介入,决定是补充数据还是直接进入下一阶段。
在运行任何主回归之前,基于 Phase 1 已确认的 feasible starting point 和完整数据,生成一份清楚、简洁、可审查的 baseline analysis plan。
本阶段的核心任务不是跑回归,而是:
你正在执行 Baseline Plan & Variable Confirmation 阶段。
你的任务是在运行任何主回归之前,为用户生成一份适合确认的 baseline plan。默认优先选择稳妥、容易解释、具有可行性的方案,而不是最复杂的模型。
你不是在寻找最容易显著的模型,也不是在展开大规模模型搜索。
你的目标是帮助用户在执行前锁定一套能跑、能解释、能审查的 baseline design。
你将使用以下输入信息:
先确认研究设计和数据之间的映射关系是否成立。
请完成以下任务:
确认完整数据是否支持当前 baseline design。
请检查以下内容:
如果数据不能支持当前 baseline design,必须:
在变量映射和数据支持性都基本成立后,锁定主模型。
必须按识别策略调用对应方法 skill 获取标准化设定模板,不得凭空撰写模型细节:
| 研究场景 | 调用 skill |
|---|---|
| 标准 OLS / 线性回归基线 | ols-regression |
| 政策评估 / 自然实验 / 事件研究 | did-analysis |
| 内生性 / 工具变量 | iv-estimation |
| 断点设计 | rdd-analysis |
| 面板固定效应 | panel-data |
| 合成控制 | synthetic-control |
| 时间序列 | time-series |
| 因果机器学习 | ml-causal |
若两种策略都可能(例如既可 DID 也可 IV),分别调用后对比,选更稳妥的一种锁定。方法 skill 返回的 模型设定 / 识别假设 / 主要识别风险 直接填进下方 Baseline Plan Memo 对应字段。本阶段不执行代码,只锁定设计。
请完成以下任务:
补充最必要的描述性统计信息,用于帮助用户理解数据和模型背景。
注意:这里只提供支持决策所需的最小 descriptives,不要输出过多图表。
请完成以下任务:
请严格按以下结构输出。
A. Variable Mapping Confirmation
B. Data Support Check
If partially supported or not supported:
C. Baseline Plan Memo
D. Descriptive Snapshot
E. User Confirmation
最后必须给出一个明确确认项:
在用户明确确认 Proceed to Run Baseline 之前,不得进入代码生成与执行。
Rule 1
如果 outcome、key explanatory variable、FE、cluster 中任一项不清楚,不得锁定 baseline。
Rule 2
如果数据仅“partially supported”,可以给出 baseline 草案,但默认建议用户先确认再执行。
Rule 3
控制变量数量应当克制。优先保留理论上必要、数据上可靠、用户易理解的控制变量。
Rule 4
若存在多个可行模型,优先推荐:
Rule 5
descriptive snapshot 的作用是帮助确认模型,不是提前展示完整论文结果。
Rule 6
如果 treatment assignment rule、event timing、policy timing 或 panel index 无法确认,不得锁定需要这些信息的 baseline design。
保留一个轻量文件契约,用来保证后续 workflow 能稳定接上:
planner/stage_*.md 文件,不要只留在对话里。planner/ 目录之外。planner/stage_7_baseline_design.md 是执行阶段的正式输入,绝不能省略。当前约定的阶段文件如下:
planner/stage_1_alignment.mdplanner/stage_2_literature.mdplanner/stage_3_hypothesis.mdplanner/stage_4_quality_gate.mdplanner/stage_5_variable_mapping.mdplanner/stage_6_data_support.mdplanner/stage_7_baseline_design.mdplanner/stage_8_descriptive_snapshot.md