Contenido de la habilidad

Document Conversion with Pandoc

Convert documents between formats using pandoc. This skill handles any conversion pandoc supports, with first-class support for producing polished Word documents from Markdown.

Prerequisites

Pandoc must be installed on the system. Check with:

pandoc --version

If not installed, recommend:

macOS: brew install pandoc
Ubuntu/Debian: sudo apt install pandoc
Windows: choco install pandoc or download from https://pandoc.org/installing.html

pandoc input.md -o output.docx \
  --reference-doc=SKILL_PATH/assets/reference.docx \
  --lua-filter=SKILL_PATH/assets/docx-polish.lua

python SKILL_PATH/scripts/fix-list-indent.py output.docx

# Markdown → HTML
pandoc input.md -o output.html --standalone

# Markdown → PDF (requires LaTeX)
pandoc input.md -o output.pdf

# Word → Markdown
pandoc input.docx -o output.md

# HTML → Markdown
pandoc input.html -o output.md

# Markdown → LaTeX
pandoc input.md -o output.tex

# Multiple inputs → single output
pandoc chapter1.md chapter2.md chapter3.md -o book.docx \
  --reference-doc=SKILL_PATH/assets/reference.docx \
  --lua-filter=SKILL_PATH/assets/docx-polish.lua

Always use the reference template and Lua filter unless the user provides their own:

pandoc input.md -o output.docx \
  --reference-doc=SKILL_PATH/assets/reference.docx \
  --lua-filter=SKILL_PATH/assets/docx-polish.lua
python SKILL_PATH/scripts/fix-list-indent.py output.docx

User-provided templates take priority. If the user specifies a custom .docx template, use it instead:
```
pandoc input.md -o output.docx --reference-doc=path/to/custom-template.docx
```

Table of contents — add --toc for longer documents:

pandoc input.md -o output.docx \
  --reference-doc=SKILL_PATH/assets/reference.docx \
  --lua-filter=SKILL_PATH/assets/docx-polish.lua --toc
python SKILL_PATH/scripts/fix-list-indent.py output.docx

Metadata — pandoc reads YAML front-matter from Markdown files for title, author, and date:
```
---
title: My Document
author: Author Name
date: 2025-01-15
---
```

Error	Cause	Fix
`pandoc: command not found`	Pandoc not installed	Install pandoc (see Prerequisites)
`Could not find reference.docx`	Wrong path to reference template	Verify the SKILL_PATH and that assets/reference.docx exists
`pdflatex not found`	No LaTeX engine for PDF output	Install LaTeX or convert to DOCX instead
`Could not convert image`	Unsupported image format	Convert images to PNG/JPEG first

pip install python-docx
pandoc --print-default-data-file reference.docx > base.docx
python SKILL_PATH/scripts/customize-reference.py base.docx SKILL_PATH/assets/reference.docx

python SKILL_PATH/scripts/obsidian-img-preprocess.py input.md --image-dir attachments | \
  pandoc -f markdown -o output.docx \
    --reference-doc=SKILL_PATH/assets/reference.docx \
    --lua-filter=SKILL_PATH/assets/docx-polish.lua
python SKILL_PATH/scripts/fix-list-indent.py output.docx

Obsidian Syntax	Converted To
`![[image.png]]`	`![image.png](attachments/image.png)`
`![[image.png\|alt text]]`	`![alt text](attachments/image.png)`
`![[image.png\|600]]`	`![image.png](attachments/image.png){ width=600px }`
`![[image.png\|800x400]]`	`![image.png](attachments/image.png){ width=800px height=400px }`
`![[subfolder/img.png]]`	`![img.png](attachments/subfolder/img.png)`

python SKILL_PATH/scripts/obsidian-img-preprocess.py input.md --image-dir attachments -o preprocessed.md
pandoc preprocessed.md -o output.docx \
  --reference-doc=SKILL_PATH/assets/reference.docx \
  --lua-filter=SKILL_PATH/assets/docx-polish.lua

Doc Convert | Skills Pool

Doc Convert

Doc Convert

Document Conversion with Pandoc

Prerequisites

Quick Reference

Markdown → Word (recommended workflow)

Other Common Conversions

Conversion Guidelines

When converting TO Word (.docx)

When converting TO HTML

When converting TO PDF

When converting FROM Word (.docx)

Handling Errors

Customizing the Reference Template

Obsidian Image Embeds

Advanced Options

Feishu Doc

Summarize

Nano Pdf

Diffs

Customs Trade Compliance

Nutrient Document Processing