SOP 位置: 本 skill 是 docs/SOP.md Step 2 的执行细节。 上一步: 代码开发 (Step 1) | 下一步: request-review (Step 3a)

Quality Gate

开发完成到提 review 之间的双重关卡：对照 spec 自检 + 用真实命令输出证明你的声明。

核心知识

两条铁律合一：

Spec alignment（来自 spec-compliance-check）：AC 可能写偏，先回读原始需求，再逐项验收
Evidence before claims（来自 verification-before-completion）：没有运行命令、没看到输出，就不能说"通过了"

铁律：NO COMPLETION CLAIMS WITHOUT FRESH VERIFICATION EVIDENCE

自问："我是这次真的运行了命令并看到输出，还是我只是相信它能工作？"

为什么 AC 可能不够：AC 是人写的，可能遗漏 UX 要求或场景覆盖。F041 教训：AC 全打勾，但铲屎官的原始需求（能力显示描述、多项目管理）根本没进 AC——spec compliance check 检查了 AC，但 AC 本身就是错的。

BEFORE 声称完成 / 提 review: Step 0: VISION CHECK（愿景核对） ① 找原始 Discussion/Interview 文档（铲屎官原话在里面） ② 读核心痛点："我要..."、"我不想..." ③ 问自己：铲屎官坐在 Hub 前用这个功能，体验是什么样的？ ④ AC 是否完整覆盖了铲屎官的原始需求？ → 如有遗漏，先补 AC 再继续 Step 0.5: DELIVERY COMPLETENESS CHECK ① 这次交付的是完整 feat 还是 feat 的一部分？ → 完整 feat：继续 → 部分：有铲屎官明确同意分批交付的记录吗？没有就继续做完 ② 本次产出后续需要"重写"还是"扩展"？ → 扩展：通过 → 重写：如果是已标注 Spike 且有结论，通过；否则不通过，回去重做 Step 1: FIND — 找 spec/plan 文档 - the active feature spec or implementation plan - 同时找 Discussion/Interview（铲屎官原话所在） Step 2: CREATE — 建检查清单 - 列出每一个 AC / 功能点 / 边界条件 - 列出 Discussion 里的 UX 描述和场景 Step 3: VERIFY — 逐项检查 - 代码在哪？有测试覆盖？边界处理了？ - 🔴 交付物必须核实 commit/PR 状态（git log --grep + gh pr list） spec checkbox 是记录工具，不是真相源（LL-029） - 🔴 新增 MCP 工具 → `MCP_TOOLS_SECTION` 更新了吗？（F086 教训：造了工具猫不知道） - 🔴 新增行为规则 → governance digest / shared-rules 注入更新了吗？ Step 4: RUNTIME GUARD — 前端证据采集前先做运行态保护 - 若会话在 `cat-cafe-runtime`，先探活：`curl -sf http://localhost:3004/health` - 服务已在线时直接复用，禁止在该会话执行 `pnpm start` / `pnpm runtime:start` / `./scripts/start-dev.sh` - `localhost:3003/3004` 默认按 runtime 处理；如果你要验证未合入改动，不能把这两个端口的页面/接口响应当成当前分支的证据 - 证明“这是我当前 worktree 的验证证据”时，必须同时说清：`worktree/cwd` + 目标 URL。两者对不上 = 证据无效 - 确需重启时，先获铲屎官明确授权，再用 `CAT_CAFE_RUNTIME_RESTART_OK=1` 执行 - **Alpha 优先**：验证已合入 main 的改动时，优先用 `pnpm alpha:start`（3011/3012/4111/6398）取证，而非 runtime。Alpha 环境每次启动自动同步 origin/main Step 5: PEN CHECK — 自动化设计稿对照（不可跳过！） ① glob designs/**/*.pen，匹配当前 feat 编号或关键词 ② 若匹配到 .pen 文件 → 强制进入设计稿对照流程（见下方"有 .pen 设计稿的功能额外要求"） ③ 若无匹配 → 检查 feat 是否有前端 UI 改动（改了 packages/web/src/components/） → 有 UI 改动但无 .pen → 在报告中标注"⚠️ 无设计稿，跳过对照" ④ 此步骤不依赖猫猫"记得"——必须执行 glob 命令，用输出决定是否进入对照 Step 6: RUN — 运行验证命令（必须这次真实运行） pnpm test # 必须全部通过 pnpm lint # 0 errors pnpm check # 0 errors（biome 格式 + lint） pnpm -r --if-present run build # exit 0 # Redis 相关改动额外跑： pnpm --filter @cat-cafe/api test:redis # ⚠️ pnpm check 包含 biome format + lint 规则。 # 如果有 format 问题，先跑 pnpm check:fix 自动修复。 # 不能带着 biome errors 提 review！（2026-03-12 铲屎官定调） Step 7: READ — 完整读输出，看 exit code，数失败数 Step 7.5: ARTIFACT HYGIENE CHECK — 根目录媒体垃圾闸门 - 执行（工作树）： `git status --short | rg '^.. [^/]+\.(png|jpe?g|webp|gif|webm|mp4|mov|wav|pdf|pen)$'` - 执行（已提交差异）： `git diff --name-only origin/main...HEAD | rg '^[^/]+\.(png|jpe?g|webp|gif|webm|mp4|mov|wav|pdf|pen)$'` - 任一命中 → BLOCK：说明仓库根目录出现了媒体/设计工件（含已跟踪和未跟踪） - 处理方式：移到 `${TMPDIR}/cat-cafe-evidence/...` 或显式归档到正式目录后再继续 - 规则真相源：`cat-cafe-skills/refs/evidence-output-contract.md` Step 8: REPORT — 输出合规报告 + 证据

Claim	需要	不够用
测试通过	这次运行输出：0 failures	"上次跑过"、"应该通过"
lint 干净	lint 输出：0 errors	部分检查、推断
biome 干净	pnpm check：0 errors	"先跑通再说"、"回头再改格式"
构建成功	build 命令：exit 0	lint 通过不代表编译通过
Bug 修了	原症状测试：通过	代码改了，以为修了
需求满足	spec + Discussion 逐项打勾	测试通过就完事
Feature 完成/未完成	git log + PR 状态 + spec 逐项	只看 spec checkbox 就下结论

错误	正确做法
只检查 AC，没回读 Discussion	Step 0 先读原始需求，AC 可能不完整
"上次跑测试是通过的"	这次重新跑，看输出，再声明
"应该没问题" / "probably works"	Run the command. Read the output.
测试通过就声称 phase 完成	还要对照 spec 逐项检查
部分实现就提 review	P1/P2 遗漏必须当轮补完再提 review
交付半成品让铲屎官"先看看"	交付完整 feat，步骤是内部节奏不是交付批次
产出后续要重写而非扩展	如果要重写，说明绕路了（Spike 除外）
前端功能没有截图证据	≤3 张截图 + 15s 录屏 + 映射表
有 .pen 设计稿但没对照实现	Step 5 自动 glob 检测，匹配到就强制对照，不靠记忆
为了截图在 runtime 会话里重跑 `pnpm start`	先探活复用现有 runtime；确需重启必须显式授权
拿 runtime 的 `3003/3004` 页面当成当前 worktree 的验证结果	报告里同时写明 `pwd/worktree` 和目标 URL；如果 URL 是 `3003/3004`，默认这是 runtime 证据，不是未合入改动证据
截图/录屏/设计稿顺手掉进仓库根目录	Step 7.5 必查；先移到 `${TMPDIR}/cat-cafe-evidence/...` 或正式归档目录，再继续
Redis 改动用默认测试命令	必须跑 `test:redis`，禁止直连 6399
只看 spec checkbox 就声称完成/未完成	核实 `git log --grep` + `gh pr list` + 实际 commit（LL-029）

Skill	关注点	时机
quality-gate（本 skill）	spec 对照 + 证据验证	提 review 之前
`merge-gate`	reviewer 是否放行、P1/P2 是否全修	合入 main 之前
`receive-review`	如何处理 reviewer 的反馈	收到 review 之后

Quality Gate

Quality Gate

Quality Gate

核心知识

流程

Quick Reference

Common Mistakes

和其他 skill 的区别

下一步

Test

Feature Flags

Unit Tests

Integration Tests

Write Frontend Tests

Golang Testing