Name: Pdf Processing Pro
Author: Microck

Search skills.../

Pdf Processing Pro | Skills Pool

python scripts/extract_tables.py report.pdf --output tables.csv
# Extracts all tables with automatic column detection

python scripts/analyze_form.py input.pdf [--output fields.json] [--verbose]

python scripts/fill_form.py input.pdf data.json output.pdf [--validate]

python scripts/validate_form.py data.json schema.json

python scripts/extract_tables.py input.pdf [--output tables.csv] [--format csv|excel]

python scripts/extract_text.py input.pdf [--output text.txt] [--preserve-formatting]

python scripts/merge_pdfs.py file1.pdf file2.pdf file3.pdf --output merged.pdf

python scripts/split_pdf.py input.pdf --output-dir pages/

python scripts/validate_pdf.py input.pdf

# 1. Analyze form structure
python scripts/analyze_form.py template.pdf --output schema.json

# 2. Validate submission data
python scripts/validate_form.py submission.json schema.json

# 3. Fill form
python scripts/fill_form.py template.pdf submission.json completed.pdf

# 4. Validate output
python scripts/validate_pdf.py completed.pdf

# 1. Extract tables
python scripts/extract_tables.py monthly_report.pdf --output data.csv

# 2. Extract text for analysis
python scripts/extract_text.py monthly_report.pdf --output report.txt

import glob
from pathlib import Path
import subprocess

# Process all PDFs in directory
for pdf_file in glob.glob("invoices/*.pdf"):
    output_file = Path("processed") / Path(pdf_file).name

    result = subprocess.run([
        "python", "scripts/extract_text.py",
        pdf_file,
        "--output", str(output_file)
    ], capture_output=True)

    if result.returncode == 0:
        print(f"✓ Processed: {pdf_file}")
    else:
        print(f"✗ Failed: {pdf_file} - {result.stderr}")

# Exit codes
# 0 - Success
# 1 - File not found
# 2 - Invalid input
# 3 - Processing error
# 4 - Validation error

# Example usage in automation
result = subprocess.run(["python", "scripts/fill_form.py", ...])

if result.returncode == 0:
    print("Success")
elif result.returncode == 4:
    print("Validation failed - check input data")

Pdf Processing Pro

Quick start

Extract text from PDF

Analyze PDF form (using included script)

Fill PDF form with validation

Pdf Processing Pro

Quick start

Extract text from PDF

Analyze PDF form (using included script)

Fill PDF form with validation

Extract tables from PDF

Features

✅ Production-ready scripts

✅ Comprehensive workflows

Advanced topics

PDF Form Processing

Table Extraction

OCR Processing

Included scripts

Form processing

Table extraction

Text extraction

Utilities

Common workflows

Workflow 1: Process form submissions

Workflow 2: Extract data from reports

Workflow 3: Batch processing

Error handling

Feishu Doc

Summarize

Nano Pdf

Diffs

Customs Trade Compliance

Nutrient Document Processing