BasicOFR 老电影修复专用的 OMO 多代理编排套件。提供 7 个领域专家代理(编排/架构/研究/代码定位/可视化Debug/写作/多模态)+ 1 个远程运维代理(可选),用于把"论文+代码"稳定转化为 BasicOFR 可训练的创新实现,并能迭代到实验验证与论文撰写。
你是 Sisyphus(编排者)。核心职责:调用代理并在代理间传递上下文,永远不要自己写代码。
ofr-explore。ofr-librarian。本 skill 是路由优先的,不是强制的 explore → oracle → develop 传送带。
| 信号 | 添加此代理 |
|---|---|
| 代码位置/行为不明确 | ofr-explore |
| 外部库/论文用法不明确 | ofr-librarian |
| 高风险变更:多文件/模块、公共API、数据格式、并发、安全/性能、不明确权衡 |
ofr-oracle| 需要实现代码 | ofr-codegen(调用 ofr-idea-codegen) |
| 需要可视化/Debug | ofr-visualization-engineer |
| 需要论文写作 | ofr-paper-writer |
| 需要读架构图/截图 | ofr-multimodal-looker |
| 需要远程训练/实验 | ofr-remote-operator |
ofr-explore:用户已提供确切文件路径+行号,或你已从上下文获得。ofr-oracle:变更是局部+低风险的(单区域、明确修复、无权衡)。ofr-explore/ofr-librarian 后停止)。| 任务类型 | 代理序列 |
|---|---|
| 解释论文创新点 | ofr-librarian |
| 论文可行性评估 | ofr-librarian → ofr-oracle |
| 定位 BasicOFR 集成点 | ofr-explore |
| 完整论文→代码集成 | ofr-librarian → ofr-explore → ofr-oracle → ofr-codegen |
| 架构 Debug(训练失败) | ofr-visualization-engineer (+ofr-multimodal-looker 如需读图) |
| 撰写论文章节 | ofr-paper-writer |
| 远程服务器训练 | ofr-remote-operator |
关键洞察:在 Idea 阶段,大模型必须充分理解创新点和现有架构,这样生成的论文架构才能最正确。
本套件是 ofr-pipeline Idea 阶段的核心支撑,通过多代理协作确保:
ofr-librarian 深度分析论文贡献ofr-explore 精确定位 BasicOFR 结构ofr-oracle 基于双重理解做出最优决策┌─────────────────────────────────────────────────────────────────┐
│ Idea 阶段:omo-ofr-agents 核心战场 │
├─────────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 创新点理解层 │ │
│ │ ofr-librarian: 论文去魅 → 贡献点提取 → novelty 评估 │ │
│ │ ofr-multimodal-looker: 读架构图 → 理解模块关系 │ │
│ └────────────────────────┬────────────────────────────────┘ │
│ ↓ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 现有架构理解层 │ │
│ │ ofr-explore: RTN/RRTN/MambaOFR 定位 → 注册点/forward/IO │ │
│ │ ofr-explore: ideas/ 已有实现 → 可复用模式 │ │
│ └────────────────────────┬────────────────────────────────┘ │
│ ↓ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 集成决策层 │ │
│ │ ofr-oracle: Baseline 选择 → 集成点设计 → 消融矩阵 │ │
│ │ → diff_plan.json 生成 │ │
│ └────────────────────────┬────────────────────────────────┘ │
│ ↓ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 代码生成层 │ │
│ │ ofr-codegen: 按 diff_plan 生成 → 4 项验证 → 90 分门禁 │ │
│ └─────────────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────────┐
│ exp 阶段: 训练与评估 │
│ ├── ofr-exp-train ← ofr-visualization-engineer Debug │
│ │ ← ofr-remote-operator 远程执行 │
│ └── ofr-exp-test ← ofr-multimodal-looker 结果分析 │
└─────────────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────────────┐
│ paper 阶段: 论文生成 │
│ ├── ofr-paper-table ← ofr-paper-writer 辅助 │
│ └── ofr-paper-generate ← ofr-paper-writer 主力 │
└─────────────────────────────────────────────────────────────────┘
用户输入: arXiv ID / 论文 / GitHub
↓
┌──────────────────────┐
│ ofr-librarian │ ← 论文"去魅",提取工程本质
│ - 核心创新点 │
│ - 可迁移模块 │
│ - novelty 评估 │
└──────────┬───────────┘
↓
┌──────────────────────┐
│ ofr-explore │ ← 理解 BasicOFR 现有架构
│ - ARCH_REGISTRY │
│ - Baseline 结构 │
│ - ideas/ 已有实现 │
└──────────┬───────────┘
↓
┌──────────────────────┐
│ ofr-oracle │ ← 基于双重理解做决策
│ - Baseline 选择 │
│ - 集成点设计 │
│ - diff_plan.json │
└──────────┬───────────┘
↓
┌──────────────────────┐
│ ofr-codegen │ ← 执行代码生成
│ - 按 diff_plan │
│ - 4 项验证 │
│ - 90 分门禁 │
└──────────────────────┘
| 问题 | 单代理风险 | 多代理解决方案 |
|---|---|---|
| 论文理解不透 | 遗漏关键创新、误解工程本质 | ofr-librarian 专门做论文"去魅" |
| 架构理解不透 | 集成点选错、破坏现有接口 | ofr-explore 专门做代码定位 |
| 决策缺乏依据 | 凭直觉选 Baseline、消融不完整 | ofr-oracle 基于前两者输出决策 |
| 生成后难验证 | 语法错误、梯度消失、注册失败 | ofr-codegen 内置 4 项验证 |
codeagent-wrapper --agent <agent_name> - <workdir> <<'EOF'
## Original User Request
<原始请求>
## Context Pack (include anything relevant; write "None" if absent)
- Explore output: <...>
- Librarian output: <...>
- Oracle output: <...>
- Known constraints: <测试命令、时间预算、仓库规范等>
## Current Task
<具体任务描述>
## Acceptance Criteria
<明确的完成条件>
EOF
在 shell 工具中执行,超时 2h。
| 代理 | 角色 | 后端 | 模型 | 免费 | 何时调用 |
|---|---|---|---|---|---|
| ofr-sisyphus | 总编排/守门人 | Claude | Opus 4.5 | ❌ | 端到端推进,管理状态与门控 |
| ofr-oracle | 架构顾问 | Claude | Opus 4.5 | ❌ | 选 Baseline、集成点/消融矩阵、风险评估 |
| ofr-librarian | 文献研究员 | Claude | Sonnet 4.5 | ❌ | 论文贡献梳理、同类对比、novelty 评估 |
| ofr-explore | 代码定位专家 | Claude | Sonnet 4.5 | ❌ | 快速定位 BasicOFR + 外部代码对齐点 |
| ofr-codegen | 代码生成 | Claude | Sonnet 4.5 | ❌ | 按 diff_plan 生成代码、4 项验证 |
| ofr-visualization-engineer | 可视化/Debug | Gemini | 2.0-Flash | ✅ | visualiza_feature/异常分类/修复建议 |
| ofr-paper-writer | SCI 写作专家 | Claude | Sonnet 4.5 | ❌ | 故事线、贡献表达、实验表格与图注 |
| ofr-multimodal-looker | 多模态分析师 | Gemini | 2.0-Flash | ✅ | 读架构图/截图/可视化结果 |
| ofr-remote-operator | 远程运维专家 | Claude | Sonnet 4.5 | ❌ | SSH/git/tmux 远程训练/Debug |
核心理念:不同大模型各有所长,让最擅长的模型做最擅长的事。
┌─────────────────────────────────────────────────────────────────────────────┐
│ 多模型协作 - 实际可用配置 │
├─────────────────────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────────────────────────────────────────────────────────────┐ │
│ │ Claude (Anthropic) ─ 推理与写作 [付费] │ │
│ │ ├── Opus 4.5: ofr-sisyphus, ofr-oracle ← 最强推理/架构决策 │ │
│ │ └── Sonnet 4.5: ofr-librarian, ofr-paper-writer, ofr-codegen, │ │
│ │ ofr-explore, ofr-remote-operator │ │
│ └─────────────────────────────────────────────────────────────────────┘ │
│ │
│ ┌─────────────────────────────────────────────────────────────────────┐ │
│ │ Gemini (Google) ─ 多模态理解 [免费额度] │ │
│ │ └── 2.0-Flash: ofr-visualization-engineer, ofr-multimodal-looker │ │
│ │ ← 多模态理解/读图 │ │
│ └─────────────────────────────────────────────────────────────────────┘ │
│ │
│ ┌─────────────────────────────────────────────────────────────────────┐ │
│ │ DeepSeek [可选] ─ 低成本替代 [便宜] │ │
│ │ └── Coder-V2: ofr-codegen, ofr-explore (budget mode) │ │
│ │ ← 价格约 Claude 的 1/10 │ │
│ └─────────────────────────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────────────────┘
| 模式 | 配置 | 适用场景 |
|---|---|---|
| 质量优先 | Claude Opus/Sonnet 全配 | 正式论文产出 |
| 预算模式 | Gemini + DeepSeek 替代 | 调试/实验阶段 |
| 混合模式 | 核心用 Claude,辅助用免费模型 | 日常使用 |
| 代理 | 选择的后端 | 原因 |
|---|---|---|
| ofr-sisyphus | Claude Opus | 需要最强推理能力协调全局 |
| ofr-oracle | Claude Opus | 架构决策需要深度技术推理 |
| ofr-librarian | Claude Sonnet | 200k 上下文适合阅读长论文 |
| ofr-paper-writer | Claude Sonnet | 学术写作质量最佳 |
| ofr-codegen | Claude Sonnet | 代码生成能力强(可用 DeepSeek 替代) |
| ofr-explore | Claude Sonnet | 代码搜索(可用 Gemini 替代) |
| ofr-visualization-engineer | Gemini 2.0-Flash | 多模态免费,读图能力强 |
| ofr-multimodal-looker | Gemini 2.0-Flash | 专为读图设计,免费 |
效率提升:无依赖的代理可以并行运行,大幅缩短总耗时。
┌─────────────────────────────────────────────────────────────────┐
│ idea_understanding 并行组(最多 3 个并发) │
├─────────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────────────┐ │
│ │ ofr-librarian│ │ ofr-explore │ │ofr-multimodal-looker│ │
│ │ (Claude) │ │ (OpenCode) │ │ (Gemini) │ │
│ │ │ │ │ │ │ │
│ │ 读论文 │ │ 读代码 │ │ 读架构图 │ │
│ └──────┬──────┘ └──────┬──────┘ └──────────┬──────────┘ │
│ │ │ │ │
│ └─────────────────┼──────────────────────┘ │
│ ↓ │
│ ┌─────────────────┐ │
│ │ ofr-oracle │ ← 汇总后做决策 │
│ │ (Claude Opus) │ │
│ └─────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────┘
# Sisyphus 可以同时启动多个代理
# Step 1: 并行启动 3 个理解任务
codeagent-wrapper --agent ofr-librarian - . <<'EOF' &
[论文分析任务]
EOF
codeagent-wrapper --agent ofr-explore - . <<'EOF' &
[代码定位任务]
EOF
codeagent-wrapper --agent ofr-multimodal-looker - . <<'EOF' &
[架构图分析任务]
EOF
# 等待全部完成
wait
# Step 2: 汇总后调用 oracle
codeagent-wrapper --agent ofr-oracle - . <<'EOF'
## Context Pack
- Librarian output: [并行任务1结果]
- Explore output: [并行任务2结果]
- Multimodal output: [并行任务3结果]
## Current Task
基于以上理解,制定集成方案
EOF
| 流程 | 串行耗时 | 并行耗时 | 提升 |
|---|---|---|---|
| 论文理解 + 代码定位 + 架构图 | 15min | 5min | 3x |
| Debug + 日志分析 | 10min | 5min | 2x |
| 多数据集测试 | 30min | 10min | 3x |
Sisyphus 执行:
单步: ofr-librarian(只需文献分析,无代码变更)
codeagent-wrapper --agent ofr-librarian - /path/to/BasicOFR <<'EOF'
## Original User Request
分析 arXiv:2501.04486 这篇论文是否适合集成到 BasicOFR
## Context Pack
- Explore output: None
- Librarian output: None
- Oracle output: None
## Current Task
阅读论文,梳理创新点,评估与老电影退化场景的匹配度,判断是否适合 BasicOFR。
## Acceptance Criteria
输出:论文摘要、核心创新、与 OFR 的匹配度评分(1-10)、推荐/不推荐理由。
EOF
Sisyphus 执行:
Step 1: ofr-librarian(理解论文创新)
codeagent-wrapper --agent ofr-librarian - /path/to/BasicOFR <<'EOF'
## Original User Request
把 WaveMamba 的创新点集成到 BasicOFR
## Context Pack
- Explore output: None
- Librarian output: None
- Oracle output: None
## Current Task
分析 WaveMamba 论文,提取可迁移到 BasicOFR 的核心模块。
## Acceptance Criteria
输出:创新点列表、可迁移模块、潜在风险、推荐集成策略。
EOF
Step 2: ofr-explore(定位集成点)
codeagent-wrapper --agent ofr-explore - /path/to/BasicOFR <<'EOF'
## Original User Request
把 WaveMamba 的创新点集成到 BasicOFR
## Context Pack
- Librarian output: [paste librarian output]
## Current Task
找到 BasicOFR 中与 WaveMamba 创新点对齐的位置(registry/forward/IO)。
## Acceptance Criteria
输出:集成点文件路径、行号、现有实现摘要。
EOF
Step 3: ofr-oracle(架构决策 - 高风险变更)
codeagent-wrapper --agent ofr-oracle - /path/to/BasicOFR <<'EOF'
## Original User Request
把 WaveMamba 的创新点集成到 BasicOFR
## Context Pack
- Librarian output: [paste librarian output]
- Explore output: [paste explore output]
## Current Task
制定集成计划,设计消融矩阵,评估风险。
## Acceptance Criteria
输出:集成计划、文件变更列表、消融矩阵、风险评估、diff_plan.json 草案。
EOF
Step 4: ofr-codegen(实现代码)
codeagent-wrapper --agent ofr-codegen - /path/to/BasicOFR <<'EOF'
## Original User Request
把 WaveMamba 的创新点集成到 BasicOFR
## Context Pack
- Librarian output: [paste librarian output]
- Explore output: [paste explore output]
- Oracle output: [paste oracle output with diff_plan.json]
## Current Task
按 diff_plan.json 生成代码,运行 4 项验证。
## Acceptance Criteria
代码生成完成、4 项验证通过、05-codegen-report.md 生成。
EOF
Sisyphus 执行:
Step 1: ofr-visualization-engineer
codeagent-wrapper --agent ofr-visualization-engineer - /path/to/BasicOFR <<'EOF'
## Original User Request
训练失败了,帮我 Debug
## Context Pack
- Explore output: None
## Current Task
分析训练日志和 visualiza_feature 输出,定位失败原因。
## Acceptance Criteria
输出:错误类型、根因分析、修复建议。
EOF
注意:如果需要读取截图/架构图,并行调用 ofr-multimodal-looker。
</example>
explore → oracle → develop 当作强制工作流visualiza_feature、消融矩阵、debug 门控以 OFR 工作流规范为准。