Skill ファイル

Harness Work

Name: Harness Work
Author: Chachamaru127

HAR:Plans.md タスクを1件から全並列チーム実行まで担当。実装して、実行して、全部やって、breezing、チーム実行、parallel で起動。プランニング・レビュー・リリース・セットアップには使わない。

Chachamaru127556 スター2026/04/16

職業
カテゴリ: スクリプティング

スキル内容

Harness の統合実行スキル。以下の旧スキルを統合:

work — Plans.md タスクの実装（スコープ自動判断）
impl — 機能実装（タスクベース）
breezing — チームフル自動実行
parallel-workflows — 並列ワークフロー最適化
ci — CI 失敗時の復旧

Quick Reference

ユーザー入力	モード	動作
`harness-work`	auto	タスク数で自動判定（下記参照）
`harness-work all`	auto	全未完了タスクを自動モードで実行
`harness-work 3`	solo	タスク3だけ即実行
`harness-work --parallel 5`	parallel	5ワーカーで並列実行（強制）
`harness-work --codex`	codex	Codex CLI に委託（明示時のみ）
`harness-work --breezing`	breezing

関連 Skill

Harness Work | Skills Pool

対象タスク数	自動選択モード	理由
1 件	Solo	オーバーヘッド最小。直接実装が最速
2〜3 件	Parallel（Task tool）	Worker 分離のメリットが出始める閾値
4 件以上	Breezing	Lead 調整 + Worker 並列 + Reviewer 独立の三者分離が効果的

オプション	説明	デフォルト
`all`	全未完了タスクを対象	-
`N` or `N-M`	タスク番号/範囲指定	-
`--parallel N`	並列ワーカー数	auto
`--sequential`	直列実行強制	-
`--codex`	Codex CLI で実装委託（明示時のみ、自動選択しない）	false
`--no-commit`	自動コミット抑制	false
`--resume <id\|latest>`	前回セッション再開	-
`--breezing`	Lead/Worker/Reviewer のチーム実行	false
`--no-tdd`	TDD フェーズスキップ	false
`--no-simplify`	Auto-Refinement スキップ	false
`--auto-mode`	Auto Mode rollout を明示。親セッションの permission mode が互換な場合のみ採用を検討	false

harness-work
どこまでやりますか?
1) 次のタスク: Plans.md の次の未完了タスク → Solo で実行
2) 全部（推奨）: 残りのタスクをすべて完了 → タスク数で自動モード選択
3) 番号指定: タスク番号を入力（例: 3, 5-7）→ 件数で自動モード選択

要素	条件	スコア
ファイル数	変更対象 4 ファイル以上	+1
ディレクトリ	core/, guardrails/, security/ を含む	+1
キーワード	architecture, security, design, migration を含む	+1
失敗履歴	agent memory に同タスクの失敗記録あり	+2
明示指定	PM テンプレートに ultrathink 記載あり	+3（自動採用）

Plans.md を読み込み、対象タスクを特定
- Plans.md が存在しない場合: harness-plan create --ci を自動呼び出し → Plans.md を生成して続行
- ヘッダーに DoD / Depends カラムがない場合: Plans.md が旧フォーマットです。harness-plan create で再生成してください。 → 停止
- 会話に未記載タスクがある場合: 直前の会話コンテキストから要件を抽出し、Plans.md に cc:TODO で自動追記
  - 抽出ロジック: ユーザー発言からアクション動詞（「〜を追加」「〜を修正」「〜を実装」）を検出
  - 追記時は v2 フォーマット（Task / 内容 / DoD / Depends / Status）に準拠
  - 追記後、ユーザーに「Plans.md に以下を追記しました」と表示（5 秒タイムアウト付きプロンプト、デフォルト: 続行） 1.5. タスク背景確認（30 秒）:
- タスクの「内容」と「DoD」から目的（このタスクが解く課題）を 1 行で推論表示
- git grep / Glob で 影響範囲（変更が及ぶファイル/モジュール）を推論表示
- 推論に自信がある場合: そのまま実装に進む（フロー遅延なし）
- 推論に自信がない場合: ユーザーに 1 問だけ確認（「この理解で合っていますか？」）
タスクを cc:WIP に更新
TDD フェーズ（[skip:tdd] なし & テストFW存在時）: a. テストファイルを先に作成（Red） b. 失敗を確認
node scripts/generate-sprint-contract.js <task-id> で sprint-contract.json を生成
Reviewer 観点の追記を scripts/enrich-sprint-contract.sh で加え、scripts/ensure-sprint-contract-ready.sh で approved を確認
Advisor consult（必要時のみ）:
- 高リスク task（needs-spike / security-sensitive / state-migration）は、初回実行前に 1 回だけ相談する
- 同じ原因の失敗が 2 回続いたら、3 回目に入る前に相談する
- plateau（行き詰まり検知）が PIVOT_REQUIRED を返した時は、ユーザーへ止めて投げる前に 1 回だけ相談する
- 相談結果は advisor-response.v1 で受け取り、PLAN は進め方の組み替え、CORRECTION は局所修正、STOP は即エスカレーションとして扱う
- 同じ trigger_hash では 1 回しか相談しない。task ごとの相談回数は最大 3 回
コードを実装（Green）（Read/Write/Edit/Bash）
/simplify で Auto-Refinement（--no-simplify で省略可）
自動レビューステージ（「レビューループ」参照）:
- Codex exec 優先でレビュー実行 → フォールバックで内部 Reviewer agent
- sprint-contract.json の reviewer_profile が runtime の場合は scripts/run-contract-review-checks.sh を実行
- REQUEST_CHANGES の場合: 指摘を元に修正→再レビュー（MAX_REVIEWS = read_contract(contract_path, ".review.max_iterations") or 3）
- APPROVE で次ステップへ。self-check だけでは完了を確定しない
scripts/write-review-result.sh で review artifact を正規化して保存（browser profile は --browser-result を渡し、browser_verdict == PENDING_BROWSER の時は static verdict を採用）
git commit で自動コミット（--no-commit で省略可）
タスクを cc:完了 に更新（commit hash 付与）

# タスク委託（書き込み可能）
bash scripts/codex-companion.sh task --write "タスク内容"

# stdin 経由（大きなプロンプト向け）
CODEX_PROMPT=$(mktemp /tmp/codex-prompt-XXXXXX.md)
# タスク内容を書き出し
cat "$CODEX_PROMPT" | bash scripts/codex-companion.sh task --write
rm -f "$CODEX_PROMPT"

# 前回スレッドの続行
bash scripts/codex-companion.sh task --resume-last --write "続きをやって"

Lead (this agent)
├── Worker (task-worker agent) — 実装担当
├── Advisor (claude-code-harness:advisor) — 方針助言
└── Reviewer (code-reviewer agent) — レビュー担当

for task in execution_order:
    # B-1. sprint-contract を生成
    contract_path = bash("node scripts/generate-sprint-contract.js {task.number}")
    contract_path = bash("scripts/enrich-sprint-contract.sh {contract_path} --check \"DoD を reviewer 観点で確認\" --approve")
    bash("scripts/ensure-sprint-contract-ready.sh {contract_path}")

    # B-2. Worker spawn（フォアグラウンド、worktree 分離）
    # Agent tool の戻り値に agentId が含まれる — 修正ループで SendMessage に使用
    Plans.md: task.status = "cc:WIP"  # 着手時に更新（未着手タスクは cc:TODO のまま）

    worker_result = Agent(
        subagent_type="claude-code-harness:worker",
        prompt="タスク: {task.内容}\nDoD: {task.DoD}\ncontract_path: {contract_path}\nmode: breezing",
        isolation="worktree",
        run_in_background=false  # フォアグラウンドで実行 → Worker 完了まで待機
    )
    worker_id = worker_result.agentId  # SendMessage 用に保持
    # worker_result には {commit, worktreePath, files_changed, summary} が含まれる

    # B-3. Worker が advice request を返した時だけ、Lead が Advisor を呼ぶ
    if worker_result.type == "advisor-request.v1":
        advisor_result = spawn_agent({
            message: worker_result.request_json,
            agent_type: "default"
        })
        resume_agent({ id: worker_id })
        send_input({
            target: worker_id,
            message: "advisor-response.v1: {advisor_result}"
        })
        worker_result = wait_agent({ targets: [worker_id] })

    # B-4. Lead がレビュー実行（Codex exec 優先）
    diff_text = git("-C", worker_result.worktreePath, "show", worker_result.commit)
    verdict = codex_exec_review(diff_text) or reviewer_agent_review(diff_text)
    profile = jq(contract_path, ".review.reviewer_profile")
    review_input = "review-output.json"
    if profile == "runtime":
        review_input = bash("cd {worker_result.worktreePath} && scripts/run-contract-review-checks.sh {contract_path}")
        runtime_verdict = jq(review_input, ".verdict")
        if runtime_verdict == "REQUEST_CHANGES":
            verdict = "REQUEST_CHANGES"
        elif runtime_verdict == "DOWNGRADE_TO_STATIC":
            pass  # runtime 検証コマンドなし → static verdict をそのまま使う
    browser_result = ""
    if profile == "browser":
        # browser artifact から route / browser_mode / execution_instructions を再利用して browser runner を起動する。
        browser_artifact = bash("scripts/generate-browser-review-artifact.sh {contract_path}")
        browser_result = bash("scripts/browser-review-runner.sh {browser_artifact}")
        browser_verdict = jq(browser_result, ".browser_verdict")
        if browser_verdict == "REQUEST_CHANGES":
            verdict = "REQUEST_CHANGES"
        elif browser_verdict == "APPROVE" and verdict != "REQUEST_CHANGES":
            verdict = "APPROVE"
        # browser_verdict == PENDING_BROWSER のときは static verdict を維持する
    # review_input が DOWNGRADE_TO_STATIC の場合は static review 結果を使う
    if review_input != "review-output.json" and jq(review_input, ".verdict") == "DOWNGRADE_TO_STATIC":
        review_input = "review-output.json"  # static review の結果にフォールバック
    bash("scripts/write-review-result.sh {review_input} {latest_commit} --browser-result {browser_result}")

    # B-5. 修正ループ（REQUEST_CHANGES 時、contract の max_iterations まで）
    # Worker はフォアグラウンドで完了済みなので、resume_agent + send_input で再開する
    review_count = 0
    # sprint-contract が存在するときのみ max_iterations を読む。存在しない場合は 3（後方互換）
    MAX_REVIEWS = read_contract(contract_path, ".review.max_iterations") or 3
    latest_commit = worker_result.commit
    while verdict == "REQUEST_CHANGES" and review_count < MAX_REVIEWS:
        resume_agent(worker_id)
        send_input(worker_id, "指摘内容: {issues}\n修正して amend してください")
        # Worker が修正 → amend → 更新された commit hash を返す
        updated_result = wait_agent(worker_id)
        latest_commit = updated_result.commit
        diff_text = git("-C", worker_result.worktreePath, "show", latest_commit)
        verdict = codex_exec_review(diff_text) or reviewer_agent_review(diff_text)
        review_count++

    # B-6. APPROVE → trunk に cherry-pick（feature ブランチ経由）
    # Worker の Branch Guard により trunk HEAD は動かず、commit は feature ブランチ上にある想定
    if verdict == "APPROVE":
        TRUNK=$(git symbolic-ref refs/remotes/origin/HEAD 2>/dev/null | sed 's|refs/remotes/origin/||' || echo "main")
        git checkout "$TRUNK"  # safety: 既に trunk なら no-op
        # feature ブランチの commit が既に trunk にある（Branch Guard 失敗時のフォールバック）か確認
        if git("merge-base", "--is-ancestor", latest_commit, "HEAD"):
            pass  # 既に trunk 上 — cherry-pick 不要（再入防止）
        else:
            git cherry-pick --no-commit {latest_commit}  # feature branch → trunk
            git commit -m "{task.内容}"
        # Worker の worktree を remove してから feature ブランチを削除
        if worker_result.worktreePath:
            git worktree remove {worker_result.worktreePath} --force
        if worker_result.branch and worker_result.branch not in ["main", "master"] and worker_result.branch != TRUNK:
            git branch -D {worker_result.branch}
        Plans.md: task.status = "cc:完了 [{hash}]"
        # auto-checkpoint 記録（冪等性ガード (c)）
        # Plans.md 書き換え直後に呼ぶ。失敗しても fail-open（|| true）でループを止めない
        HASH=$(git rev-parse --short HEAD)
        REVIEW_RESULT_PATH=".claude/state/review-results/${task.number}.review-result.json"
        bash scripts/auto-checkpoint.sh \
            "${task.number}" "${HASH}" "${contract_path}" "${REVIEW_RESULT_PATH}" \
            || true  # fail-open: harness-mem 未起動環境でも継続
    else:
        → ユーザーにエスカレーション

    # B-7. Progress feed
    print("📊 Progress: Task {completed}/{total} 完了 — {task.内容}")

node scripts/generate-sprint-contract.js 32.1.1

条件	アクション
`cc:完了` 後にテスト失敗	修正タスク案を state に保存し、承認を待つ
CI 失敗（3回未満）	修正を実施し、失敗カウントをインクリメント
CI 失敗（3回目）	修正タスク案を提示 + エスカレーション

1. Codex exec（優先）
   ↓ codex コマンドが存在しない or タイムアウト（120s）
2. 内部 Reviewer agent（フォールバック）

重要度	定義	verdict への影響
critical	セキュリティ脆弱性、データ損失リスク、本番障害の可能性	1 件でも → REQUEST_CHANGES
major	既存機能の破壊、仕様との明確な矛盾、テスト不通過	1 件でも → REQUEST_CHANGES
minor	命名改善、コメント不足、スタイル不統一	verdict に影響しない
recommendation	ベストプラクティス提案、将来の改善案	verdict に影響しない

# タスク開始時に base ref を記録（Step 2 の cc:WIP 更新前に実行）
BASE_REF=$(git rev-parse HEAD)

# ... 実装完了後 ...

# 公式プラグインの構造化レビューを実行
bash scripts/codex-companion.sh review --base "${BASE_REF}"
REVIEW_EXIT=$?

公式 plugin	Harness	verdict 影響
`approve`	`APPROVE`	-
`needs-attention`	`REQUEST_CHANGES`	-
`findings[].severity: critical`	`critical_issues[]`	1件でも → REQUEST_CHANGES
`findings[].severity: high`	`major_issues[]`	1件でも → REQUEST_CHANGES
`findings[].severity: medium/low`	`recommendations[]`	verdict に影響しない

# AI Residuals スキャン（companion review と並行実行可能）
AI_RESIDUALS_JSON="$(bash scripts/review-ai-residuals.sh --base-ref "${BASE_REF}" 2>/dev/null || echo '{"tool":"review-ai-residuals","scan_mode":"diff","base_ref":null,"files_scanned":[],"summary":{"verdict":"APPROVE","major":0,"minor":0,"recommendation":0,"total":0},"observations":[]}')"

Agent tool: subagent_type="reviewer"

Harness Work

Quick Reference

Harness Work

Quick Reference

Execution Mode Auto Selection（フラグなし時の自動判定）

ルール

オプション

スコープダイアログ（引数なし時）

Effort レベル制御（v2.1.68+, v2.1.72 簡素化）

多要素スコアリング

注入方法

実行モード詳細

Solo モード（1 件時の自動選択）

Parallel モード（2〜3 件時の自動選択 / `--parallel N` で強制）

Codex モード（`--codex` 明示時のみ）

Breezing モード（4 件以上で自動選択 / `--breezing` で強制）

Advisor Protocol（全モード共通）

Solo モードでの Advisor

Sprint Contract

CI 失敗時の対応

失敗タスクの自動再チケット化

トリガー条件

修正タスクの自動生成

レビューループ

レビュー実行の優先順位

APPROVE / REQUEST_CHANGES の判定基準

Codex exec レビュー（公式プラグイン経由）

内部 Reviewer agent フォールバック

Prose

Coding Agent (bash-first)

Create Prompt

Strategic Compact

Strategic Compact

Strategic Compact

Harness Work

Quick Reference

Harness Work

Quick Reference

Execution Mode Auto Selection（フラグなし時の自動判定）

ルール

オプション

スコープダイアログ（引数なし時）

Effort レベル制御（v2.1.68+, v2.1.72 簡素化）

多要素スコアリング

注入方法

実行モード詳細

Solo モード（1 件時の自動選択）

Parallel モード（2〜3 件時の自動選択 / --parallel N で強制）

Codex モード（--codex 明示時のみ）

Breezing モード（4 件以上で自動選択 / --breezing で強制）

Advisor Protocol（全モード共通）

Solo モードでの Advisor

Sprint Contract

CI 失敗時の対応

失敗タスクの自動再チケット化

トリガー条件

修正タスクの自動生成

レビューループ

レビュー実行の優先順位

APPROVE / REQUEST_CHANGES の判定基準

Codex exec レビュー（公式プラグイン経由）

内部 Reviewer agent フォールバック

Prose

Coding Agent (bash-first)

Create Prompt

Strategic Compact

Strategic Compact

Strategic Compact

Parallel モード（2〜3 件時の自動選択 / `--parallel N` で強制）

Codex モード（`--codex` 明示時のみ）

Breezing モード（4 件以上で自動選択 / `--breezing` で強制）