Name: Paper Translate
Author: Davinci-Meg

Paper Translate

英語論文（PDF）を日本語に翻訳・要約するスキル。1ファイルでも複数ファイルでも対応。PDFのMarkdown変換・日本語翻訳・構造化サマリー生成・PDF出力を一括で行い、論文タイトル名のフォルダにまとめて保存する。「論文を翻訳して」「英語の論文を日本語にして」「PDFを要約して」「DownloadsにあるXXXの論文を翻訳して」「○○フォルダ内のPDFを全部翻訳して」など、論文・PDF翻訳・要約に関する依頼があれば必ずこのスキルを使うこと。他のスキルへの依存なし。

Davinci-Meg0 starsMar 16, 2026

Occupation
Categories: Documents

英語論文のPDFを受け取り、論文タイトル名のフォルダを作成して以下のファイルを格納するスキル。1ファイルでも複数ファイルでも動作する。

<出力先>/<論文タイトル>/
├── images/                 — PDFから抽出した図表画像
├── paper.md                — 原文のMarkdown変換（英語・画像埋め込み）
├── paper.ja.md             — 日本語翻訳（本文のみ翻訳、見出しは英語保持・画像埋め込み）
├── paper.summary.ja.md     — 日本語の構造化サマリー
├── paper.ja.pdf            — 日本語翻訳のPDF版（画像・CJK改行対応）
└── paper.summary.ja.pdf    — 日本語サマリーのPDF版

起動方法

1ファイル・複数ファイル・フォルダ指定、いずれもパスでも自然言語でも指定できる：

/paper-translate ~/Downloads/attention_is_all_you_need.pdf
/paper-translate DownloadsフォルダのAttention is All You Needの論文
/paper-translate ~/papers/ 内のPDFを全部
/paper-translate デスクトップのpapers フォルダにあるPDFら

実行ステップ

Step 0: 対象PDFファイルの特定

入力を解釈して、処理対象のPDFファイルリストを作成する。

単一ファイルの場合:

Paper Translate

Davinci-Meg0 starsMar 16, 2026

Occupation
Categories: Documents

<出力先>/<論文タイトル>/ ├── images/ — PDFから抽出した図表画像 ├── paper.md — 原文のMarkdown変換（英語・画像埋め込み） ├── paper.ja.md — 日本語翻訳（本文のみ翻訳、見出しは英語保持・画像埋め込み） ├── paper.summary.ja.md — 日本語の構造化サマリー ├── paper.ja.pdf — 日本語翻訳のPDF版（画像・CJK改行対応） └── paper.summary.ja.pdf — 日本語サマリーのPDF版

起動方法

1ファイル・複数ファイル・フォルダ指定、いずれもパスでも自然言語でも指定できる：

/paper-translate ~/Downloads/attention_is_all_you_need.pdf /paper-translate DownloadsフォルダのAttention is All You Needの論文 /paper-translate ~/papers/ 内のPDFを全部 /paper-translate デスクトップのpapers フォルダにあるPDFら

import json from pathlib import Path from pdf2image import convert_from_path from PIL import Image def load_model(): from doclayout_yolo import YOLOv10 import huggingface_hub model_path = huggingface_hub.hf_hub_download( "juliozhao/DocLayout-YOLO-DocStructBench", "doclayout_yolo_docstructbench_imgsz1024.pt", ) return YOLOv10(model_path) def merge_figure_and_caption(figures, captions, margin=15): merged = [] used_captions = set() for fig in figures: fb = fig["bbox"] best_cap = None best_dist = float("inf") for i, cap in enumerate(captions): if i in used_captions: continue cb = cap["bbox"] dist = abs(cb[1] - fb[3]) x_overlap = min(fb[2], cb[2]) - max(fb[0], cb[0]) if x_overlap > 0 and dist < best_dist and dist < 400: best_dist = dist best_cap = (i, cap) if best_cap: i, cap = best_cap used_captions.add(i) cb = cap["bbox"] merged_bbox = [ min(fb[0], cb[0]) - margin, min(fb[1], cb[1]) - margin, max(fb[2], cb[2]) + margin, max(fb[3], cb[3]) + margin, ] else: merged_bbox = [fb[0] - margin, fb[1] - margin, fb[2] + margin, fb[3] + margin] merged.append({ "bbox": merged_bbox, "figure_bbox": fb, "caption_bbox": best_cap[1]["bbox"] if best_cap else None, "confidence": fig["confidence"], }) return merged def extract_figures(pdf_path, output_dir): pdf_path = Path(pdf_path) images_dir = Path(output_dir) / "images" images_dir.mkdir(parents=True, exist_ok=True) # PDF → ページ画像 pages = convert_from_path(str(pdf_path), dpi=300) page_dir = Path(output_dir) / "_pages" page_dir.mkdir(exist_ok=True) page_paths = [] for i, page in enumerate(pages): p = page_dir / f"page_{i+1:03d}.png" page.save(str(p), "PNG") page_paths.append(p) # YOLO で検出・切り抜き model = load_model() fig_index = 0 img_meta = {} for page_num, page_path in enumerate(page_paths): det = model.predict(str(page_path), imgsz=1024, conf=0.2) results = det[0] boxes = results.boxes names = results.names figures = [] captions = [] for i in range(len(boxes)): cls_name = names[int(boxes.cls[i])] conf = float(boxes.conf[i]) bbox = [int(v) for v in boxes.xyxy[i].tolist()] if cls_name == "figure": figures.append({"bbox": bbox, "confidence": conf}) elif cls_name == "figure_caption": captions.append({"bbox": bbox, "confidence": conf}) if not figures: continue merged = merge_figure_and_caption(figures, captions) img = Image.open(page_path) w, h = img.size page_width = w for m in merged: fig_index += 1 bbox = [max(0, m["bbox"][0]), max(0, m["bbox"][1]), min(w, m["bbox"][2]), min(h, m["bbox"][3])] cropped = img.crop(bbox) # 表示幅の割合を計算 fig_bbox = m["figure_bbox"] fig_width = fig_bbox[2] - fig_bbox[0] width_pct = round(fig_width / page_width * 100) width_pct = max(20, min(width_pct, 100)) filename = f"figure_{fig_index}.png" cropped.save(str(images_dir / filename), "PNG") img_meta[filename] = { "width_pct": width_pct, "page": page_num + 1, "confidence": m["confidence"], } print(f"Page {page_num+1}: {filename} ({cropped.size[0]}x{cropped.size[1]}, width={width_pct}%, conf={m['confidence']:.3f})") # メタデータを保存 with open(str(images_dir / "meta.json"), "w") as f: json.dump(img_meta, f, indent=2) # 一時ページ画像を削除 import shutil shutil.rmtree(page_dir) print(f"Extracted {fig_index} figures") return img_meta if __name__ == "__main__": import sys extract_figures(sys.argv[1], sys.argv[2])

OS	優先フォント
Windows	Yu Gothic, Meiryo, MS Gothic
macOS	Hiragino Sans, Hiragino Mincho
Linux	Noto Sans CJK JP, IPAexGothic

問題	原因	対策
`Undefined control sequence` at `\n`	テキスト中の `\n` がLaTeXコマンドとして解釈される	バッククォートで囲む: `\n`
`Undefined control sequence` at `\マ` 等	Windowsパスのバックスラッシュ `\`	パスをバッククォートで囲む: `G:\path`
テーブルの列が見切れる	列幅が固定されない	簡素なテーブルに書き換えるか、長い行を折り返す

状況	対応
自然言語からPDFを特定できない	候補ファイルを列挙してユーザーに選択を求める
PDFが見つからない	パスを確認してユーザーに再入力を求める
複数件処理中に1件失敗	エラーを記録して残りの処理を続行し、最後にまとめて報告する
pandoc が未インストール	MDファイルは保存済みであることを伝え、インストール案内をする
lualatex が未インストール	`--pdf-engine=xelatex` にフォールバック（ただしCJK改行は手動で確認）。それも失敗したらMDのみで完了とする
日本語フォントが見つからない	`Noto Sans CJK JP` のインストールを案内し、暫定的に `DejaVu Sans` で試みる
pymupdf / pdfimages が未インストール	画像抽出をスキップし、プレースホルダー `[Figure N]` で続行する
抽出画像が巨大（>5MB）	品質を維持しつつリサイズ検討。ただしそのまま使用しても問題ない
LaTeXビルドエラー	エラーメッセージからMarkdown内の特殊文字を特定し、バッククォートで囲むなどして修正
非常に長い論文（50ページ超）	セクションごとに分割処理し、最後に結合する

Paper Translate

起動方法

実行ステップ

Step 0: 対象PDFファイルの特定

Paper Translate

起動方法

実行ステップ

Step 0: 対象PDFファイルの特定

Step 1: 出力フォルダの作成

Step 1.5: PDFから図版を抽出（`<出力フォルダ>/images/`）

パイプライン概要

抽出コード

実行方法

必要なパッケージ

検出の仕組み

フォールバック

Step 2: PDFをMarkdownに変換（`<出力フォルダ>/paper.md`）

Step 3: MarkdownをJapanese翻訳（`<出力フォルダ>/paper.ja.md`）

Step 4: サマリー生成（`<出力フォルダ>/paper.summary.ja.md`）

Step 5: PDF出力（`paper.ja.pdf` / `paper.summary.ja.pdf`）

5-1: pandoc のインストール確認

5-2: 日本語フォント確認

5-3: LaTeXヘッダーファイルの作成

5-4: PDF変換実行

5-5: LaTeXエスケープ問題への対処

5-6: 後片付け

Step 6: 完了報告

エラーハンドリング

Feishu Doc

Summarize

Nano Pdf

Diffs

Customs Trade Compliance

Nutrient Document Processing

Paper Translate

起動方法

実行ステップ

Step 0: 対象PDFファイルの特定

Paper Translate

起動方法

実行ステップ

Step 0: 対象PDFファイルの特定

Step 1: 出力フォルダの作成

Step 1.5: PDFから図版を抽出（<出力フォルダ>/images/）

パイプライン概要

抽出コード

実行方法

必要なパッケージ

検出の仕組み

フォールバック

Step 2: PDFをMarkdownに変換（<出力フォルダ>/paper.md）

Step 3: MarkdownをJapanese翻訳（<出力フォルダ>/paper.ja.md）

Step 4: サマリー生成（<出力フォルダ>/paper.summary.ja.md）

Step 5: PDF出力（paper.ja.pdf / paper.summary.ja.pdf）

5-1: pandoc のインストール確認

5-2: 日本語フォント確認

5-3: LaTeXヘッダーファイルの作成

5-4: PDF変換実行

5-5: LaTeXエスケープ問題への対処

5-6: 後片付け

Step 6: 完了報告

エラーハンドリング

Feishu Doc

Summarize

Nano Pdf

Diffs

Customs Trade Compliance

Nutrient Document Processing

Step 1.5: PDFから図版を抽出（`<出力フォルダ>/images/`）

Step 2: PDFをMarkdownに変換（`<出力フォルダ>/paper.md`）

Step 3: MarkdownをJapanese翻訳（`<出力フォルダ>/paper.ja.md`）

Step 4: サマリー生成（`<出力フォルダ>/paper.summary.ja.md`）

Step 5: PDF出力（`paper.ja.pdf` / `paper.summary.ja.pdf`）