고고학 발굴조사 고찰 작성 자동화 파이프라인 마스터 오케스트레이터
"고찰작성" 명령 하나로 발굴조사 보고서의 고찰(考察) 섹션을 자동으로 작성하는 통합 파이프라인입니다. 6개의 전문 스킬을 순차적으로 실행하여 국가유산청 규정에 부합하는 고품질 고찰을 생성합니다.
사용자 입력: "고찰작성"
↓
┌─────────────────────────────────────────────────────────┐
│ STEP 1: data-normalizer │
│ - 논문/, 발굴조사보고서/, 주변유적/ 폴더 스캔 │
│ - 텍스트 추출 및 메타데이터 정규화 │
│ - 출력: documents.jsonl, metadata.csv │
└─────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────┐
│ STEP 2: similarity-matcher │
│ - 대상지 중심으로 주변 유적 탐색 │
│ - 공간·시대·유형 유사도 계산 │
│ - 출력: nearby_ranked.csv, nearby_summaries.jsonl │
└─────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────┐
│ STEP 3: regulation-checker │
│ - 국가유산청 규정 체크리스트 생성 │
│ - 현재 자료 대비 결손 항목 분석 │
│ - 출력: checklist.md, gaps.md │
└─────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────┐
│ STEP 4: discussion-drafter │
│ - 8개 섹션 고찰 초안 작성 (30~50쪽) │
│ - 주변 유적 비교·편년·의의 등 종합 분석 │
│ - 출력: discussion.md │
└─────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────┐
│ STEP 5: tables-appendix │
│ - 비교표, 일람표, 참고문헌, 영문 초록 생성 │
│ - 출력: tables.md, appendix.md, references.md │
└─────────────────────────────────────────────────────────┘
↓
┌─────────────────────────────────────────────────────────┐
│ STEP 6: compliance-audit │
│ - 규정 준수 검증 및 품질 평가 │
│ - 개선안 생성 (Version 2) │
│ - 출력: discussion_v2.md, compliance_report.md │
└─────────────────────────────────────────────────────────┘
↓
완료: output/final/* 준비 완료
mkdir -p 논문 발굴조사보고서 주변유적 output
논문/: 관련 학술 논문 PDF 파일 (최소 5개 권장)발굴조사보고서/: 주변 지역 발굴조사 보고서 PDF/HWP (최소 10개 권장)주변유적/: 주변 유적 관련 자료 (보고서, 논문, 기사 등)다음 정보를 미리 준비해두세요:
조사명: "○○지구 유적 발굴조사"
조사기관: "○○문화재연구원"
조사기간: "2024.03 ~ 2024.11"
조사면적: "5,000㎡"
대상지_좌표:
위도: 37.5665
경도: 126.9780
비교_반경: 20 # km
주요_시대:
- "청동기시대"
- "원삼국시대"
주요_유구:
- 주거지: 12기
- 수혈유구: 34기
주요_유물:
- "무문토기"
- "석기(석촉, 마제석검)"
- "적색마연토기"
특기사항: "환상 배치 구조 확인"
Claude에게 다음과 같이 요청하세요:
archaeology-orchestrator 스킬을 사용하여 고찰을 작성해주세요.
조사 정보:
- 조사명: ○○지구 유적
- 조사기관: ○○문화재연구원
- 조사기간: 2024.03~2024.11
- 대상지 좌표: 위도 37.5665, 경도 126.9780
- 시대: 청동기시대, 원삼국시대
- 주요 유구: 주거지 12기, 수혈 34기
- 주요 유물: 무문토기, 석기, 적색마연토기
또는 간단히:
고찰작성
(이 경우 오케스트레이터가 대화형으로 정보를 물어봅니다)
파이프라인이 실행되는 동안 각 단계별 진행 상황이 표시됩니다:
✓ STEP 1/6 완료: 자료 수집 및 정규화
→ 총 42개 파일 처리, 40개 성공
→ output/normalized/documents.jsonl 생성
✓ STEP 2/6 완료: 주변 유적 매칭
→ 20km 내 15개 유적 발견, 상위 10개 선정
→ output/compare/nearby_ranked.csv 생성
✓ STEP 3/6 완료: 규정 체크리스트 생성
→ 68개 항목 체크리스트 생성
→ 불충분 항목 5개 식별
→ output/compliance/checklist.md 생성
✓ STEP 4/6 완료: 고찰 초안 작성
→ 8개 섹션, 42쪽 분량
→ 68개 인용, 15개 도면 언급
→ output/draft/discussion.md 생성
✓ STEP 5/6 완료: 표 및 부록 생성
→ 비교표 7개, 참고문헌 42개
→ 영문 초록 256단어
→ output/draft/tables.md, references.md 생성
✓ STEP 6/6 완료: 규정 준수 검증
→ 준수율 92% (우수)
→ Version 2 생성 (3개 항목 개선)
→ output/final/discussion_v2.md 생성
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
✓ 파이프라인 완료!
최종 산출물:
📄 output/final/discussion_v2.md (고찰 최종본)
📊 output/draft/tables.md (비교표·일람표)
📎 output/draft/appendix.md (부록)
📚 output/draft/references.md (참고문헌)
📋 output/final/compliance_report.md (검증 보고서)
총 소요 시간: 약 12분
output/
├── normalized/ # STEP 1 출력
│ ├── documents.jsonl # 전체 문서 내용
│ ├── metadata.csv # 메타데이터 요약
│ └── extraction_log.txt # 처리 로그
├── compare/ # STEP 2 출력
│ ├── nearby_ranked.csv # 주변 유적 랭킹
│ ├── nearby_summaries.jsonl # 유적별 요약
│ └── map_visualization.html # 분포 지도 (선택)
├── compliance/ # STEP 3 출력
│ ├── checklist.md # 규정 체크리스트
│ ├── gaps.md # 결손 항목 보고서
│ └── regulation_references.md # 규정 전문
├── draft/ # STEP 4, 5 출력
│ ├── discussion.md # 고찰 초안 (v1)
│ ├── tables.md # 비교표·일람표
│ ├── appendix.md # 부록
│ ├── references.md # 참고문헌
│ └── abstract_en.md # 영문 초록
└── final/ # STEP 6 출력
├── discussion_v2.md # ⭐ 고찰 최종본
├── compliance_report.md # 검증 보고서
└── change_log.md # v1→v2 변경 이력
각 스킬은 독립적으로도 사용 가능:
# 전체 파이프라인 실행
archaeology-orchestrator
# 개별 스킬만 실행
data-normalizer # 자료 정규화만
similarity-matcher # 주변 유적 비교만
discussion-drafter # 고찰 작성만
compliance-audit # 검증만
# config.yaml에서 설정
parallel_processing: true
max_workers: 4 # CPU 코어 수에 맞게 조정
# 반경 내 유적이 5개 미만일 경우 자동 확대
auto_expand_radius: true
radius_steps: [20, 50, 100] # km
# 자료 부족 시 동작 (halt / continue / request)
on_insufficient_data: "request" # 사용자에게 추가 입력 요청
min_nearby_sites: 5
min_references: 30
output_formats:
- markdown # 기본
- pdf # 선택 (pandoc 필요)
- docx # 선택 (python-docx 필요)
- html # 선택
pip install pandas numpy matplotlib seaborn
pip install PyPDF2 pdfplumber # PDF 처리
pip install olefile # HWP 처리 (또는 hwp5tools)
pip install python-docx # Word 파일 처리 (선택)
pip install geopy # 지오코딩 (선택)
# HWP → TXT 변환
sudo apt install hwp5txt
# PDF → TXT 고품질 변환
sudo apt install poppler-utils
# Markdown → PDF 변환
sudo apt install pandoc texlive-xetex
현재 버전: 1.0.0 (2025-11-12)
문제가 발생하거나 개선 제안이 있으면:
output/*/extraction_log.txt사용자: "고찰작성"
[15초 후] 조사 정보를 입력해주세요...
사용자: [정보 입력]
[12분 후] ✓ 파이프라인 완료!
output/final/discussion_v2.md 확인하세요.
사용자: "data-normalizer 실행"
[2분 후] ✓ 완료: 42개 파일 처리
사용자: "similarity-matcher 실행"
[3분 후] ✓ 완료: 10개 유적 선정
사용자: "discussion-drafter 실행"
[5분 후] ✓ 완료: 42쪽 고찰 초안
...
# 논문 5개 추가 수집 후
사용자: "data-normalizer 재실행"
[2분 후] ✓ 완료: 47개 파일 처리 (5개 추가)
사용자: "discussion-drafter 재실행"
[5분 후] ✓ 완료: 45쪽 고찰 (인용 3개 추가)
archaeology-orchestrator v1.0.0 고고학 발굴조사 보고서 고찰 작성을 혁신합니다.
"고찰작성" 한 문장으로 국가유산청 규정에 부합하는 학술적으로 엄밀한 고찰을 자동 생성하세요.