在使用者要把網址、PDF、DOCX、PPTX、XLSX 或 Confluence 匯出轉成乾淨 Markdown 時使用。常見觸發像「把這份 PDF 轉成 markdown」「讀這個網址並輸出 md」「把飛書文件抓成 Markdown」。輸出應是轉換路由、品質檢查與 Markdown 或保存路徑;不適合搜尋策略、長文件分析、YouTube 下載或網站互動。
這個 skill 負責把「不同來源的內容」先標準化成乾淨、可重用的 Markdown,再交給後續閱讀、整理或寫作流程。它吸收 markdown-tools 對本地文件轉檔與後處理的重點,也吸收 markdown-proxy 對 URL 路由、代理級聯與特定平台抽取的經驗,但會把規則改寫成較可攜、較重視隱私與宿主相容性的決策框架。
它不是搜尋 skill,也不是長文件分析 skill,更不是通用網站自動化 skill。只要主任務從「轉成 Markdown」轉成「找資料、讀證據、重寫內容或操作網站」,就該交棒。
utility / executorweb-access-advanced: 負責上網、互動與能力層調度,不以產出 Markdown 為唯一完成條件。longdoc-evidence-reader: 負責長文件切片、證據鏈與引用,不負責先把來源轉成 Markdown。technical-documentation-writer: 負責重寫與整理文件,不負責抓取或轉檔。Markdown Tools: 強在本地文件轉換、Windows/WSL 路徑與後處理。markdown-proxy: 強在 URL 抽取、代理級聯與特定平台專用通道。<decision_boundary> Use when:
Do not use when:
Inputs:
.md。Successful output:
proxy cascade 說成「代理級聯」,把 frontmatter 說成「來源中繼資訊」,把 post-processing 說成「後處理清理」。web-search-strategy: 需要先找到正確來源,而不是已知來源轉檔時。web-access-advanced: 需要瀏覽器互動、站點操作、動態頁面調查或多網站研究時。longdoc-evidence-reader: 已拿到 Markdown 或長文件後,要做證據鏈與引用時。technical-documentation-writer: 轉完後要重寫成 README、guide、FAQ 或 runbook 時。skill pack only,依賴宿主現有的 shell、web、browser 或 HTTP 工具,不把固定安裝腳本寫死在 skill 內。<success_criteria> Quantitative:
Qualitative:
Step 1: 盤點可用能力並選主要路由
Step 2: 依來源型態執行轉換
r.jina.ai -> defuddle.md -> 宿主本地抓取 fallback。Step 3: 清理 Markdown 並保留來源中繼資訊
Step 4: 做基本品質檢查並決定是否保存
.md,優先存到指定位置,否則可存到來源檔案旁或工作區合理位置。Step 5: 交棒或停止
Step 6: 最終 QA
references/quality_checklist.md 的檢查結果,確保本 skill 的 description、邊界與輸出契約仍與目前流程一致。<output_contract> Return exactly these sections in this order:
來源判定轉換路由Markdown 輸出品質檢查阻礙與下一步Formatting rules:
來源判定 要用 1-3 句交代來源型態、輸出目標與是否屬於本 skill。轉換路由 要說明主路由、fallback 與任何 ask-first 邊界。Markdown 輸出 必須提供以下其一:完整 Markdown、保存路徑加預覽片段、或失敗原因。Markdown 輸出 只顯示精簡片段,並明確標出保存路徑或未保存原因。<tool_rules>
r.jina.ai、defuddle.md 與宿主本地抓取 fallback,但私有或敏感 URL 必須先取得使用者同意才能送第三方代理。FEISHU_APP_ID / FEISHU_APP_SECRET 或等價前提,停止並回報。<default_follow_through_policy>
.md。Output:
本地 DOCX 轉 Markdown,屬於本 skill。完成條件是輸出可保存的 .md,並保留圖片參照。
主路由是文件結構優先的 DOCX 轉換器,之後做 Markdown 後處理。若主路由表格保留失敗,再用第二工具做對照。
已保存到 docs/spec.md。
# 規格標題
## 背景
...
標題層級存在,圖片路徑已指向 docs/media/,未發現明顯屬性殘留。
無
Example 2 Input:
https://team.feishu.cn/docx/abc123Output:
這是受限平台文件,屬於本 skill,但是否能完成取決於是否有可用 API 或登入前提。
主路由是飛書專用抓取或官方 API。第三方公開代理不是首選,因為可能拿不到受限內容。
尚未輸出。缺少可用的飛書憑證或等價存取能力。
未執行內容檢查,因為來源尚未成功抓取。
請提供可用的飛書存取前提,或改提供已匯出的檔案版本。 </examples>
<model_notes>
README.md。".md 路徑與品質檢查摘要。web-access-advanced、longdoc-evidence-reader、technical-documentation-writer 搶 query。assets/evals/evals.jsonassets/evals/regression_gates.jsonpython skills/skill-creator-advanced/scripts/package_skill.py <path/to/skill-folder>Symptom: 公開 URL 代理結果為空或只剩殘缺內容
Cause: 站點需要動態渲染、反爬、登入態或代理服務暫時失效
Fix: 改走瀏覽器 / 專用抓取 / 本地 fallback,並確認是否其實屬於 web-access-advanced
Symptom: 本地文件轉出來的表格、圖片或粗體格式很亂
Cause: 選錯主轉換器,或缺少必要後處理
Fix: 改用更適合該格式的主路由,並執行有限度格式清理
Symptom: 私有平台文件抓不到
Cause: 缺少登入態、API 憑證或必要權限
Fix: 停止並回報所需前提,不要硬走第三方代理
references/quality_checklist.mdassets/evals/evals.jsonassets/evals/regression_gates.json