技能档案

Harness Engineering Zh

Name: Harness Engineering Zh
Author: 10xChengTu

为 AI Agent 友好的代码库搭建和改进 Harness 工程（包括 AGENTS.md、docs/、Lint 规则、Eval 系统、项目级 Prompt 工程）。触发场景：为 AI Agent 设置新项目/空项目，创建 AGENTS.md 或 CLAUDE.md，关于 Harness 工程的问题，让 Agent 在代码库上更高效地工作。当用户感到沮丧或抱怨 Agent 质量时也会触发（例如：'Agent 总是无视规范'、'它从不听从指令'、'为什么它总是做错 X'、'Agent 坏了'）— 因为 Agent 输出质量差几乎总是意味着 Harness 缺失，而不是模型问题。涵盖：Context 工程、架构约束、多 Agent 协作、评估、长运行任务 Harness 以及 Agent 质量问题诊断。

10xChengTu69 星标2026年4月8日

职业
分类: 大语言模型与 AI

技能内容

Harness Engineering

Harness = 为项目中工作的 AI Agent 提供的操作系统。Model 是 CPU，Context 窗口是 RAM，Harness 则是操作系统。

核心原则

从简单开始，仅在必要时增加复杂度。 每一个 Harness 组件都代表了对模型无法独立完成任务的一种假设。要对这些假设进行压力测试 — 随着模型能力的提升，这些假设会失效。为"删除"而构建。

何时激活此 Skill

信号	行动
空项目/新项目	→ 进行完整的项目设置 (Section 1)
用户对 Agent 感到沮丧	→ 诊断并修复 Harness 缺失 (Section 7)
现有项目需要改进	→ 评估并逐步改进
明确的 Harness 问题	→ 参考相关章节

工作流

对于新项目

评估 (Assess) — 项目是什么？技术栈？团队规模？Agent 将如何被使用？
设置 (Setup) — 创建基础 Harness 文件 → 阅读 references/01-project-setup.md

Harness Engineering Zh

10xChengTu69 星标2026年4月8日

职业
分类: 大语言模型与 AI

技能内容

Harness Engineering

Harness = 为项目中工作的 AI Agent 提供的操作系统。Model 是 CPU，Context 窗口是 RAM，Harness 则是操作系统。

核心原则

何时激活此 Skill

信号	行动
空项目/新项目	→ 进行完整的项目设置 (Section 1)
用户对 Agent 感到沮丧	→ 诊断并修复 Harness 缺失 (Section 7)
现有项目需要改进	→ 评估并逐步改进
明确的 Harness 问题	→ 参考相关章节

工作流

对于新项目

评估 (Assess) — 项目是什么？技术栈？团队规模？Agent 将如何被使用？
设置 (Setup) — 创建基础 Harness 文件 → 阅读 references/01-project-setup.md

相关技能

层级	内容	参考文档
项目设置 (Project Setup)	AGENTS.md, docs/, 目录规范	`01-project-setup.md`
Context 工程 (Context Engineering)	Agent 看到的信息、渐进式展示、工作状态	`02-context-engineering.md`
约束与护栏 (Constraints & Guardrails)	Linters、类型系统、架构强制执行、安全自主权	`03-constraints.md`
多 Agent 架构 (Multi-Agent Architecture)	Agent 分离、协作协议、委派模式	`04-multi-agent.md`
Eval 与反馈 (Eval & Feedback)	测试、评分、GC Agent、可观测性	`05-eval-feedback.md`
长运行任务 (Long-Running Tasks)	进度跟踪、Context 重置、交付产物	`06-long-running.md`
诊断 (Diagnosis)	当 Agent 失败时 — 在 Harness 中识别根因，而非模型	`07-diagnosis.md`

Harness Engineering Zh

Harness Engineering

核心原则

何时激活此 Skill

工作流

对于新项目

Harness Engineering Zh

Harness Engineering

核心原则

何时激活此 Skill

工作流

对于新项目

对于诊断 (Agent 表现不佳)

对于逐步改进

Harness 层级 (快速参考)

自我更新协议

Openai Whisper

Voice Call

Prose

Clawhub

Sherpa Onnx Tts

Openai Whisper Api