Name: Data Annotation
Author: openclaw

Data Annotation

通用数据标注处理工具。当用户提到需要数据标注、有标注任务、数据处理、数据集生成、标注查看/编辑时使用此 skill。支持图像、视频、文本等多种数据类型，调用模型进行内容理解和标注，生成结构化标注数据，提供 Web 查看编辑界面。触发短语：「标注」「annotation」「数据集」「label」「tag data」「数据处理」。

openclaw4,189 星标2026年3月21日

职业
分类: IDE 插件

Data Annotation Skill — 数据标注处理工具

完整的数据标注工作流：需求确认 → 制定计划 → 逐条处理 → 结果存储 → Web 查看/编辑 → 部署访问。

⚠️ 核心原则：计划驱动，逐条处理，永不超时

绝对不要一次性批量处理所有数据！ 超时（通常 10 分钟）会导致任务中断、数据丢失。

正确做法：

先制定标注计划（JSON 格式），列出所有待处理数据
每次只处理 1 条数据，处理完立即保存
更新计划进度（标记已完成/失败）
汇报当前进度（已处理 X/Y，耗时 N 秒）

如果感觉快超时了，立即保存当前进度并汇报，下次从计划中未完成的位置继续。

工作流程

Step 1: 确认需求

收到标注任务后，必须先确认以下信息：

需求文档位置 — 问用户标注需求文档在哪里（路径或 URL）
待标注数据位置 — 问用户原始数据存放在哪个目录
数据类型 — 图像/视频/文本/混合
输出格式 — 如果需求文档中没有说明，询问期望的输出格式

如果用户已提供以上信息，跳过确认直接进入下一步。

Data Annotation

openclaw4,189 星标2026年3月21日

职业
分类: IDE 插件

⚠️ 核心原则：计划驱动，逐条处理，永不超时

绝对不要一次性批量处理所有数据！ 超时（通常 10 分钟）会导致任务中断、数据丢失。

正确做法：

先制定标注计划（JSON 格式），列出所有待处理数据

每次只处理 1 条数据，处理完立即保存

更新计划进度（标记已完成/失败）

汇报当前进度（已处理 X/Y，耗时 N 秒）

如果感觉快超时了，立即保存当前进度并汇报，下次从计划中未完成的位置继续。

工作流程

Step 1: 确认需求

收到标注任务后，必须先确认以下信息：

需求文档位置 — 问用户标注需求文档在哪里（路径或 URL）

待标注数据位置 — 问用户原始数据存放在哪个目录

数据类型 — 图像/视频/文本/混合

输出格式 — 如果需求文档中没有说明，询问期望的输出格式

如果用户已提供以上信息，跳过确认直接进入下一步。

数据类型	处理方式	推荐模型
图像	VL 模型分析图片内容	`qwen3.5-plus`、`kimi-k2.5`、`doubao-seed-2.0-pro`
视频	抽帧后逐帧用 VL 模型	同上
文本	LLM 文本分析	任意文本模型
音频	whisper 转写 + LLM	`whisper` + LLM
混合	按类型分别处理	组合上述方法

Data Annotation

Data Annotation Skill — 数据标注处理工具

⚠️ 核心原则：计划驱动，逐条处理，永不超时

工作流程

Step 1: 确认需求

Data Annotation

Data Annotation Skill — 数据标注处理工具

⚠️ 核心原则：计划驱动，逐条处理，永不超时

工作流程

Step 1: 确认需求

Step 2: 读取需求文档

Step 3: 扫描数据 + 制定标注计划

Step 4: 逐条处理标注（核心步骤）

模型选择策略

模型 API 调用示例（VL 模型）

每条数据处理后立即：

进度汇报格式

Step 5: 保存标注结果

Step 6: 生成 Web 查看/编辑页面

Step 7: Nginx 部署

⚠️ 实战经验教训

正确配置方式

数据目录软链接

启动 API 服务

验证

完成后汇报

引用文件

Coding Agent (bash-first)

Install Vscode Extension

Launch

Agent Customization

Init

Launch