Name: Document Tools
Author: lucasjameso

Search skills.../

Document Tools | Skills Pool

pdfimages -png input.pdf output_prefix

tesseract image.png output_text

tesseract image.png output_text -l eng

# Convert PDF pages to images
convert -density 300 input.pdf -quality 100 page-%03d.png
# OCR each page
for f in page-*.png; do tesseract "$f" "${f%.png}" -l eng; done
# Combine results
cat page-*.txt > full_text.txt

pandoc input.docx -t markdown -o output.md
pandoc input.epub -t markdown -o output.md
pandoc input.html -t markdown -o output.md
pandoc input.md -t html -o output.html

pandoc input.epub -t plain -o output.txt

convert input.png -resize 800x800 output.png

convert input.png -crop WIDTHxHEIGHT+X+Y output.png

convert input.png output.jpg

exiftool image.png

Document Tools

Document Processing Tools

PDF Operations

Document Tools

Document Processing Tools

PDF Operations

OCR (Optical Character Recognition)

Document Conversion

Image Processing

Important Notes

Feishu Doc

Summarize

Nano Pdf

Diffs

Customs Trade Compliance

Nutrient Document Processing