特定の調査研究テーマを長期的に調査・分析・ベンチマーク・レポートするスキル。 research-kbが単発調査なのに対し、research-themeは長期テーマをwave単位で継続更新する。 自律完遂/ユーザー協業の切り替え可能。Claude/Codex各自が成果物を作成→クロスレビュー→統合。 成果物はkb/research-themes/に格納。多様性は善: 単一winnerを強制せず用途別推奨を出す。 「○○を研究して」「ベンチマークして」「研究テーマ一覧」で起動。
特定の調査研究テーマを長期的に調査・分析・ベンチマーク・レポートする。research-kbが「単発対象の調査→kb/に追加」なのに対し、research-themeは「長期テーマをwave単位で継続更新するliving document」。
Phase 2-6はwave単位で反復する。テーマは育てるもの。
| Phase | 目的 | モード |
|---|---|---|
| 0: Intake | テーマ定義、自律/協業モード決定 | 必須対話 |
| 1: Framing | 調査問い、成功条件、対象・除外範囲 | 各自 |
| 2: Evidence | Web徹底調査(複数Agent並列) | 各自 |
| 3: Benchmark Design | 評価軸、シナリオ、判定基準 | Codex強め |
| 4: Wave Execution | ベンチマーク実行、証拠整理 | 各自 |
| 5: Synthesis | 結果統合、用途別推奨 | 各自 |
| 6: Cross Review | Claude/Codex相互レビュー、disagreement明文化 | 両者 |
| 7: Publish | 最終レポート、harness-harness反映 | 両者+ユーザー |
kb/research-themes/{theme-slug}/
kb/research-themes/
_index.md # テーマ一覧
{theme-slug}/
overview.md # テーマ概要(frontmatter必須)
charter.md # 調査問い・成功条件
source-map.md # ソース一覧
benchmark-design.md # 評価軸・シナリオ
benchmark-runs/ # wave別実行結果
wave-01.md
findings.md # 調査結果
harness-implications.md # harness-harnessへの適用指針
cross-reviews/ # Claude/Codex相互レビュー
final-report.md # 最終レポート
assets/ # 生成物(画像等)
---
source_skill: research-theme