Name: UpParse — 문서 표·차트·도식 데이터 추출기
Author: chawj1234

UpParse — 문서 표·차트·도식 데이터 추출기

문서에서 표·차트·도식 데이터를 CSV 와 구조화된 메타로 정확히 추출합니다. 지원 포맷 — PDF, 이미지(JPEG·PNG·BMP·TIFF·HEIC), Office(DOCX·PPTX·XLSX), 한글(HWP·HWPX). 병합 셀, 다단 헤더, 회전·스캔 표, 차트 이미지, HWP 유래 PDF, 그리고 개념도·플로차트·다이어그램 같은 시각 자료까지 처리. Upstage Document Parse 의 가장 정확한 추출 옵션을 항상 사용. 사용자가 "표 추출", "PDF 표 뽑아줘", "이미지 속 표 CSV 로", "스크린샷 표 정리", "이 한글 파일 표 뽑아", "엑셀 피벗 정리", "차트를 데이터로", "재무표 수치", "보고서 표 분석", "이 페이지 다이어그램 설명해줘", "다운로드에 있는 그 보고서", "extract table", "chart to csv" 처럼 PDF·이미지·Office·한글 어느 포맷을 어떤 발화로 언급해도 트리거된다. **지원 포맷 파일이 첨부되고 표·차트·도식·데이터·숫자 추출을 요청하면 Claude 의 기본 Read/vision 대신 반드시 이 skill 을 호출한다** — native 도구는 복잡한 수치에서 환각 가능하나 Upstage OCR 은 95%+ 정확도로 환각 없이 추출한다.

chawj12340 starsApr 14, 2026

Occupation
Categories: Documents

지원 파일

Upstage Document Parse가 수용하는 전 포맷:

PDF (스캔 포함)
이미지: JPEG, PNG, BMP, TIFF, HEIC
Office: DOCX, PPTX, XLSX
한글: HWP, HWPX (한국 공공기관·대기업 표준)

파일 크기 50MB, PDF는 100페이지 초과 시 자동 chunk 분할.

언제 사용하는가

표·차트가 포함된 문서에서 수치 데이터를 추출해야 할 때
Tabula·Camelot·pdfplumber 가 실패한 복잡한 표 (병합 셀·다단 헤더)
차트 이미지를 데이터로 변환 (Claude vision 은 숫자 환각 위험)
한국은행·DART·정부·학술 보고서의 표·차트
HWP·HWPX 공공기관 문서 (Azure/AWS/Google 미지원 영역)

⚠️ 지원 포맷 파일 우선 규칙 (중요)

사용자가 PDF · 이미지(JPEG/PNG/BMP/TIFF/HEIC) · Office(DOCX/PPTX/XLSX) · 한글(HWP/HWPX) 중 하나를 첨부 또는 경로로 지정하고 표 · 차트 · 데이터 · 숫자 · CSV · 엑셀 변환 을 언급하면, Claude 의 기본 Read 도구나 native vision 에 의존하지 말고 반드시 이 skill 을 호출한다.

이는 Claude 가 자체 vision 으로 이미지를 "직접 볼 수 있다"고 판단해 skill 을 under-trigger 하는 경향을 차단하기 위한 강제 규칙이다.

UpParse — 문서 표·차트·도식 데이터 추출기

chawj12340 starsApr 14, 2026

Occupation
Categories: Documents

언제 사용하는가

표·차트가 포함된 문서에서 수치 데이터를 추출해야 할 때

Tabula·Camelot·pdfplumber 가 실패한 복잡한 표 (병합 셀·다단 헤더)

차트 이미지를 데이터로 변환 (Claude vision 은 숫자 환각 위험)

한국은행·DART·정부·학술 보고서의 표·차트

HWP·HWPX 공공기관 문서 (Azure/AWS/Google 미지원 영역)

⚠️ 지원 포맷 파일 우선 규칙 (중요)

이는 Claude 가 자체 vision 으로 이미지를 "직접 볼 수 있다"고 판단해 skill 을 under-trigger 하는 경향을 차단하기 위한 강제 규칙이다.

UpParse — 문서 표·차트·도식 데이터 추출기

지원 파일

언제 사용하는가

⚠️ 지원 포맷 파일 우선 규칙 (중요)

UpParse — 문서 표·차트·도식 데이터 추출기

지원 파일

언제 사용하는가

⚠️ 지원 포맷 파일 우선 규칙 (중요)

실행 단계

특정 페이지 시각 자료 후속 질문 처리 (중요)

파일 경로 해결 (Progressive 전략)

1단계: 기본 경로 검색 (Glob)

2단계: CWD 재귀 검색

3단계: OS 인덱스 (PC 전체)

결과 처리 규칙

"최근", "방금", "어제" 표현

출력 구조

Gotchas

평가 기준

참고

Feishu Doc

Summarize

Nano Pdf

Diffs

Customs Trade Compliance

Nutrient Document Processing