Name: Experiment Driven Doc
Author: ZJLi2013

Experiment Driven Doc

实验驱动的文档追溯流程。在设计假设验证实验前，先将假设、实验方案、预期结果写入文档；实验/测试完成后，将实际结果、分析、结论、next-step 写回文档。确保每一轮实验可追溯。 Use when running hypothesis-driven experiments, ablation studies, debugging investigations, or any iterative test-analyze-iterate workflow.

ZJLi20130 estrellas30 mar 2026

Ocupación
Categorías: Testing

Experiment-Driven Documentation

将"假设 → 实验设计 → 执行 → 结果 → 分析 → 下一步"全流程记录到项目文档中，做到任何人（包括未来的自己）都能复现思路和决策依据。

Workflow

Phase 0: Problem Formulation 检查（必须最先做）

在设计任何实验之前，必须先回答以下问题。如果 Phase 0 不通过，禁止进入 Phase 1。

核心问题：π(observation) → action 是单值函数吗？

Checklist：

观测完备性：observation 是否包含决定 action 所需的全部信息？
- 如果 action 依赖于某个变量（目标位置、任务 ID、环境参数等），该变量必须在 observation 中
- 反例：cube 位置随机化但 observation 只有 joint state → π(s) 不是单值函数 → MSE 收敛到无意义的均值
映射唯一性：对于 observation 空间中的任意一个点，是否存在唯一的正确 action？
- 如果同一个 observation 在不同 episode / 不同 context 对应不同 action → 问题不可解
- 检查方式：列出所有随机化变量（goal position、object pose、task type 等），确认它们要么固定、要么在 observation 中
数据-评估一致性：训练数据中的与评估时的流程是否匹配？

Experiment Driven Doc

ZJLi20130 estrellas30 mar 2026

Ocupación
Categorías: Testing

Workflow

Phase 0: Problem Formulation 检查（必须最先做）

在设计任何实验之前，必须先回答以下问题。如果 Phase 0 不通过，禁止进入 Phase 1。

核心问题：π(observation) → action 是单值函数吗？

Checklist：

观测完备性：observation 是否包含决定 action 所需的全部信息？

如果 action 依赖于某个变量（目标位置、任务 ID、环境参数等），该变量必须在 observation 中
反例：cube 位置随机化但 observation 只有 joint state → π(s) 不是单值函数 → MSE 收敛到无意义的均值

映射唯一性：对于 observation 空间中的任意一个点，是否存在唯一的正确 action？

如果同一个 observation 在不同 episode / 不同 context 对应不同 action → 问题不可解
检查方式：列出所有随机化变量（goal position、object pose、task type 等），确认它们要么固定、要么在 observation 中

数据-评估一致性：训练数据中的与评估时的流程是否匹配？

Experiment Driven Doc

Experiment-Driven Documentation

Workflow

Phase 0: Problem Formulation 检查（必须最先做）

Experiment Driven Doc

Experiment-Driven Documentation

Workflow

Phase 0: Problem Formulation 检查（必须最先做）

Phase 1: Before Experiment — 写入实验设计

Phase 1.5: Smoke Test — 快速验证脚本可运行

Phase 2: During Experiment — 实时记录

Phase 3: After Experiment — 写回结果与分析

Phase 4: 维护总览表

Commit Convention

Key Principles

Test

Feature Flags

Unit Tests

Integration Tests

Write Frontend Tests

Golang Testing