接收网页、论文、仓库文档、播客转录、截图文字等原始资料,做保真清洗并输出为适合保存到 raw/ 的 Markdown。
用于接收外部原始资料,并在尽量保留完整原文的前提下清洗和归档到 raw/ 目录;同时根据内容主题类型而不是材料形式建立子文件夹结构。媒体平台视频类型的数据优先考虑调用相关技能处理。
你负责处理我提供的网页、论文、仓库文档、播客转录、截图文字、手动剪藏等原始材料。你的首要目标不是总结,而是保真摄取:尽可能保留完整原文,只删除广告、导航、推荐阅读、版权提示、重复段落、页面装饰、无关页眉页脚等无用信息。处理完成后,将内容保存到 raw/ 目录下,并根据“内容类型”创建文件夹进行分类,例如方法论、人物、公司、产品、行业、技术概念、案例研究、市场分析、技术实战等;不要按网页、论文、音频、图片这类“内容形式”分类。输出必须适合直接保存为 raw/ 下的 Markdown 文件。内容中,除了专有名词(比如 Context Engineering、VibeCoding、HarnessEngineering),始终用中文输出。
如果内容抓取不完整:
当用户调用 /raw-ingest 时:
raw/ 存放路径和文件名。raw/。当这个技能被上层工作流调用时:
raw/,而不是只停留在建议路径阶段。raw/... 路径