LLM 앱을 에이전트 팀이 협업하여 개발하는 풀 파이프라인. 'LLM 앱 만들어줘', 'AI 앱 개발', 'RAG 시스템 구축', 'GPT 앱', 'AI 챗봇 개발', '프롬프트 엔지니어링', 'LLM 파이프라인', 'AI 어시스턴트 개발', '생성 AI 앱', 'RAG 파이프라인' 등 LLM 기반 앱 개발 전반에 이 스킬을 사용한다. 프롬프트 설계만 필요한 경우에도 프롬프트 모드로 지원한다. 단, LLM 모델 학습(fine-tuning 실행), GPU 인프라 구축, 모델 서빙(vLLM/TGI 배포)은 이 스킬의 범위가 아니다.
LLM 앱의 프롬프트→RAG→평가→최적화→배포를 에이전트 팀이 협업하여 개발한다.
에이전트 팀 — 5명이 SendMessage로 직접 통신하며 교차 검증한다.
| 에이전트 | 파일 | 역할 | 타입 |
|---|---|---|---|
| prompt-engineer | .claude/agents/prompt-engineer.md | 프롬프트 설계 | general-purpose |
| rag-architect | .claude/agents/rag-architect.md | RAG 파이프라인 | general-purpose |
| eval-specialist | .claude/agents/eval-specialist.md | 평가 프레임워크 | general-purpose |
| optimization-engineer | .claude/agents/optimization-engineer.md | 비용/성능 최적화 | general-purpose |
| deploy-engineer |
.claude/agents/deploy-engineer.md |
| 프로덕션 배포 |
| general-purpose |
_workspace/ 디렉토리를 프로젝트 루트에 생성한다_workspace/00_input.md에 저장한다_workspace/src/ 디렉토리를 생성한다| 순서 | 작업 | 담당 | 의존 | 산출물 |
|---|---|---|---|---|
| 1a | 프롬프트 설계 | prompt | 없음 | _workspace/01_prompt_design.md |
| 1b | RAG 파이프라인 | rag | 없음 | _workspace/02_rag_pipeline.md + src/ |
| 2 | 평가 프레임워크 | eval | 작업 1a, 1b | _workspace/03_eval_framework.md + src/ |
| 3 | 최적화 | optimizer | 작업 2 | _workspace/04_optimization.md + src/ |
| 4 | 배포 설정 | deploy | 작업 1b, 3 | _workspace/05_deploy_config.md + src/ |
작업 1a(프롬프트)와 1b(RAG)는 병렬 실행한다.
팀원 간 소통 흐름:
_workspace/src/의 코드가 실행 가능한지 확인한다01_prompt_design.md02_rag_pipeline.md03_eval_framework.md04_optimization.md05_deploy_config.mdsrc/| 사용자 요청 패턴 | 실행 모드 | 투입 에이전트 |
|---|---|---|
| "LLM 앱 만들어줘", "RAG 앱 전체" | 풀 파이프라인 | 5명 전원 |
| "프롬프트만 설계해줘" | 프롬프트 모드 | prompt + eval |
| "RAG 파이프라인만 구축" | RAG 모드 | rag + eval + deploy |
| "LLM 앱 평가 시스템 구축" | 평가 모드 | eval 단독 |
| "기존 앱 비용 최적화" | 최적화 모드 | optimizer + eval |
| "프로덕션 배포 설정" | 배포 모드 | deploy 단독 |
RAG 불필요 시: 사용자가 외부 데이터 소스가 없다고 명시하면 rag 에이전트를 건너뛴다.
기존 파일 활용: 사용자가 기존 프롬프트, RAG 설정, 코드 등을 제공하면, 해당 파일을 _workspace/의 적절한 번호 위치에 복사하고 해당 단계의 에이전트는 건너뛴다. 예: 기존 프롬프트 제공 → _workspace/01_prompt_design.md로 복사 → prompt 건너뛰고 나머지 에이전트만 투입.
| 전략 | 방식 | 용도 |
|---|---|---|
| 파일 기반 | _workspace/ 디렉토리 | 설계 문서 및 설정 공유 |
| 메시지 기반 | SendMessage | 실시간 핵심 정보 전달, 피드백 |
| 코드 기반 | _workspace/src/ | 실행 가능한 소스코드 |
| 에러 유형 | 전략 |
|---|---|
| LLM API 키 없음 | 환경 변수 설정 가이드 제공, 로컬 모델 대안 제시 |
| RAG 데이터 소스 없음 | RAG 없이 순수 LLM 앱으로 구축, 추후 RAG 추가 가이드 |
| 평가 데이터셋 없음 | LLM으로 합성 데이터 생성, 수동 검증 가이드 |
| 비용 예산 초과 예상 | 소형 모델 라우팅, 캐싱 강화, 요청 제한 제안 |
| 에이전트 실패 | 1회 재시도 → 실패 시 해당 산출물 없이 진행 |
프롬프트: "회사 내부 문서를 기반으로 직원 Q&A 챗봇을 만들어줘. Confluence 문서 500개 정도야. 월 예산 $200" 기대 결과:
프롬프트: "이 RAG 코드를 기반으로 평가 프레임워크와 최적화만 해줘" + RAG 코드 첨부 기대 결과:
_workspace/src/에 복사, RAG 설계를 _workspace/02_rag_pipeline.md로 복사프롬프트: "AI 앱 만들어줘" (목적/데이터 불명확) 기대 결과:
에이전트의 도메인 전문성을 강화하는 확장 스킬:
| 스킬 | 파일 | 대상 에이전트 | 역할 |
|---|---|---|---|
| prompt-optimizer | .claude/skills/prompt-optimizer/skill.md | prompt-engineer, eval-specialist | CRISP 루브릭, RCTF 템플릿, 가드레일 패턴, A/B 테스트, 토큰 최적화 |
| chunking-strategy-guide | .claude/skills/chunking-strategy-guide/skill.md | rag-architect, eval-specialist | 청킹 전략 비교, 시맨틱 청킹 알고리즘, 문서별 전처리, 품질 메트릭 |