摄取

用于接收外部原始资料，并在尽量保留完整原文的前提下清洗和归档到 raw/ 目录；同时根据内容主题类型而不是材料形式建立子文件夹结构。媒体平台视频类型的数据优先考虑调用相关技能处理。

你负责处理我提供的网页、论文、仓库文档、播客转录、截图文字、手动剪藏等原始材料。你的首要目标不是总结，而是保真摄取：尽可能保留完整原文，只删除广告、导航、推荐阅读、版权提示、重复段落、页面装饰、无关页眉页脚等无用信息。处理完成后，将内容保存到 raw/ 目录下，并根据“内容类型”创建文件夹进行分类，例如方法论、人物、公司、产品、行业、技术概念、案例研究、市场分析、技术实战等；不要按网页、论文、音频、图片这类“内容形式”分类。输出必须适合直接保存为 raw/ 下的 Markdown 文件。内容中，除了专有名词（比如 Context Engineering、VibeCoding、HarnessEngineering），始终用中文输出。

如果内容抓取不完整：

明确标记缺失部分。
说明你拿到的是正文、摘要、镜像页还是壳页。
仍然按既定 schema 输出。

使用说明

当用户调用 /raw-ingest 时：

识别用户提供的是链接、摘录、文件路径、截图内容，还是仅仅描述了待摄取的资料。
尽量获取完整正文；若无法完整获取，明确说明缺失情况。
清洗噪音内容，但不要过度改写原文。
建议一个基于内容主题的 raw/ 存放路径和文件名。
输出可直接保存的 Markdown 正文；若用户明确要求，也可以直接写入仓库中的 raw/。
若输入是视频平台内容，优先考虑调用更适合处理视频/转录的相关技能。

工作流模式

当这个技能被上层工作流调用时：

摄取

如果内容抓取不完整：

明确标记缺失部分。

说明你拿到的是正文、摘要、镜像页还是壳页。

仍然按既定 schema 输出。

使用说明

当用户调用 /raw-ingest 时：

识别用户提供的是链接、摘录、文件路径、截图内容，还是仅仅描述了待摄取的资料。

尽量获取完整正文；若无法完整获取，明确说明缺失情况。

清洗噪音内容，但不要过度改写原文。

建议一个基于内容主题的 raw/ 存放路径和文件名。

输出可直接保存的 Markdown 正文；若用户明确要求，也可以直接写入仓库中的 raw/。

若输入是视频平台内容，优先考虑调用更适合处理视频/转录的相关技能。

Raw Ingest

摄取

使用说明

工作流模式

Raw Ingest

摄取

使用说明

工作流模式

输出要求

Feishu Doc

Summarize

Nano Pdf

Diffs

Customs Trade Compliance

Nutrient Document Processing