학술 PDF 논문을 다른 언어로 번역하며, 수식, 이미지(래스터+벡터 그래픽), 문서 구조를 보존합니다. HTML과 PDF로 독립적으로 출력합니다.
학술 PDF 논문을 대상 언어로 번역하며 다음을 보존합니다:
YAML 중간 표현(Intermediate Representation)을 통한 두 개의 독립 파이프라인:
원본 PDF → 텍스트 추출 + 이미지 추출 → 번역
↓
YAML 중간 표현 (정규 소스)
↙ ↘
yaml_to_html.js yaml_to_typst.js
↓ ↓
HTML 파이프라인 PDF 파이프라인 (Typst)
- MathJax v3 수식 - Typst 네이티브 수식
- 인라인 SVG - 벡터 PDF 직접 임베딩
- base64 래스터 - 래스터 PNG 참조
→ 자체 완결형 HTML → typst compile → PDF
핵심 원칙:
YAML 파일은 metadata 블록과 content 리스트로 구성됩니다.
메타데이터 블록: