Job Api Design

04.detail-design.md（または 02.design-doc.md）を受け取り、**ジョブ処理・バッチ系 API に特化した詳細設計書**（`08.job-api-design.md`）を生成するスキル。ジョブスキーマ・キュー設計・ステータス管理・ワーカー設計・リトライ/DLQ・スケジューリング・モニタリングを網羅する。次のような状況で必ず使うこと: - 「ジョブ系APIの設計をまとめて」「バッチ処理の詳細設計が欲しい」 - SQS / Lambda / ECS Worker のような非同期ジョブ構成が含まれるとき - 「ジョブのステータス管理をどう設計する？」「DLQ の設計を教えて」 - ジョブスキーマ・ジョブキュー・ワーカー・スケジューラーが絡む設計書を作りたいとき - 04.detail-design.md を渡されて「ジョブ処理部分をもっと詳しく」と言われたとき

職業
カテゴリ: 技術ドキュメント

ジョブ処理 API 詳細設計スキル

04.detail-design.md または 02.design-doc.md をもとに、ジョブ処理・バッチ系 API の詳細設計書を生成します。

Steps

Step 1: 入力を読み込み、ジョブ処理要素を抽出する

以下の優先順でファイルを読み込む：

04.detail-design.md（既存の詳細設計）
02.design-doc.md（アーキテクチャ設計）
03.db-design.md（テーブル設計）
元の要件定義書 / readme.md

以下を抽出する：

- ジョブの種類・分類（どんな処理を非同期化するか）
- ジョブの起点（API呼び出し / スケジューラー / Webhook / ユーザー操作）
- キュー・メッセージブローカーの有無（SQS / EventBridge / 自前キュー等）
- ワーカーの実行環境（Lambda / ECS Fargate / EC2 等）
- 実行時間の見積もり（秒 / 分 / 時間オーダー）
- 冪等性が求められるかどうか
- 並行実行数・レートリミットの要件
- リトライ・失敗時の要件
- 外部サービス依存（Claude API / メール送信 / ファイルストレージ等）

Step 2: ジョブスキーマを定義する

ジョブメッセージ（SQS や DB に格納するデータ）の構造を定義する。

Job Api Design

職業
カテゴリ: 技術ドキュメント

Steps

Step 1: 入力を読み込み、ジョブ処理要素を抽出する

以下の優先順でファイルを読み込む：

04.detail-design.md（既存の詳細設計）

02.design-doc.md（アーキテクチャ設計）

03.db-design.md（テーブル設計）

元の要件定義書 / readme.md

以下を抽出する：

- ジョブの種類・分類（どんな処理を非同期化するか） - ジョブの起点（API呼び出し / スケジューラー / Webhook / ユーザー操作） - キュー・メッセージブローカーの有無（SQS / EventBridge / 自前キュー等） - ワーカーの実行環境（Lambda / ECS Fargate / EC2 等） - 実行時間の見積もり（秒 / 分 / 時間オーダー） - 冪等性が求められるかどうか - 並行実行数・レートリミットの要件 - リトライ・失敗時の要件 - 外部サービス依存（Claude API / メール送信 / ファイルストレージ等）

Step 2: ジョブスキーマを定義する

ジョブメッセージ（SQS や DB に格納するデータ）の構造を定義する。

# ジョブ処理 API 詳細設計書 — {システム名} **生成日**: {日付} **対象**: 実装担当者向け **前提**: 02.design-doc.md / 04.detail-design.md を読んでいること --- ## 1. ジョブ種別一覧 | job_type | 説明 | 起点 | 実行時間目安 | 冪等性 | |---------|------|-----|-----------|------| {ジョブ種別の一覧表} --- ## 2. ジョブスキーマ定義 ### 2-1. 共通メッセージフォーマット {Step 2 の共通フォーマット} ### 2-2. ジョブ種別別ペイロード {Step 2 のジョブ種別ごとのペイロード定義} --- ## 3. ジョブステータス管理 ### 3-1. ステータス遷移図 {Step 3 の stateDiagram} ### 3-2. ステータス定義表 {Step 3 のステータス定義表} ### 3-3. jobs テーブル設計 {Step 3 の DDL} --- ## 4. ジョブ API エンドポイント ### 4-1. エンドポイント一覧 {Step 4 のエンドポイント一覧} ### 4-2. エンドポイント詳細 {Step 4 の各エンドポイント詳細} --- ## 5. キュー設計 ### 5-1. SQS キュー構成 {Step 5 のキュー構成表} ### 5-2. キュー設計の判断基準 {Step 5 の判断基準} ### 5-3. SQS → Worker フローシーケンス図 {Step 5 の sequenceDiagram} --- ## 6. Worker 設計 ### 6-1. 実行環境選定 {Step 6 の環境選定表} ### 6-2. Worker 内部処理フロー {Step 6 の処理フロー} ### 6-3. 冪等性の実装方針 {Step 6 の冪等性方針} ### 6-4. 並行実行制御 {Step 6 の並行実行表} --- ## 7. リトライ・DLQ・エラーハンドリング ### 7-1. リトライ設計 {Step 7 のリトライ設計表} ### 7-2. DLQ 設計 {Step 7 の DLQ 設計} ### 7-3. エラーレスポンス統一フォーマット {Step 7 の API エラーフォーマット} ### 7-4. Worker エラーログフォーマット {Step 7 のログフォーマット} --- ## 8. スケジューリング設計 {Step 8 の内容（スケジュール実行がある場合のみ）} --- ## 9. モニタリング・アラート設計 ### 9-1. CloudWatch メトリクス一覧 {Step 9 のメトリクス表} ### 9-2. ダッシュボード構成 {Step 9 のダッシュボード構成} ### 9-3. SLO 定義 {Step 9 の SLO 定義表} --- ## 10. 環境変数・設定値一覧 {Step 10 の環境変数表} --- ## 11. 実装上の注意事項 - {冪等性実装の落とし穴（例: 外部API呼び出しの重複実行防止）} - {可視性タイムアウトのチューニング注意事項} - {FIFO キューの MessageGroupId 設計} - {Worker クラッシュ時のメッセージ再配信タイミング}

ステータス	説明	遷移元	遷移先
PENDING	ジョブ登録済み、キュー未送信	—	QUEUED / CANCELLED
QUEUED	キュー送信済み、Worker未取得	PENDING / FAILED	RUNNING
RUNNING	Worker処理中	QUEUED	COMPLETED / FAILED / CANCELLED
COMPLETED	正常終了	RUNNING	—
FAILED	処理失敗（リトライ可能）	RUNNING	QUEUED / DEAD
DEAD	リトライ上限超過・恒久失敗	FAILED	—
CANCELLED	キャンセル済み	PENDING / RUNNING	—

メソッド	パス	概要	認証
POST	/api/jobs	ジョブ登録・キューイング	Bearer Token
GET	/api/jobs/{job_id}	ジョブ詳細取得（ステータス確認）	Bearer Token
GET	/api/jobs	ジョブ一覧取得（フィルタ・ページング）	Bearer Token
DELETE	/api/jobs/{job_id}	ジョブキャンセル	Bearer Token
POST	/api/jobs/{job_id}/retry	手動リトライ	Bearer Token
GET	/api/jobs/{job_id}/logs	ジョブ実行ログ取得	Bearer Token

キュー名	種別	目的	メッセージ保持期間	可視性タイムアウト
{system}-jobs-high.fifo	FIFO / 高優先度	優先度 high のジョブ	4日	{実行時間上限 × 1.5} 秒
{system}-jobs-normal	Standard	通常ジョブ	4日	{実行時間上限 × 1.5} 秒
{system}-jobs-dlq	Standard	DLQ（失敗ジョブ）	14日	—

実行時間	同時実行数	推奨環境	理由
〜15分	低〜中（〜1000/日）	Lambda	コスト最小、オートスケール
〜60分	中〜高	ECS Fargate (Task)	Lambda制限回避、メモリ確保
60分超	高	ECS Fargate (Service + SQS Consumer)	常駐Worker、スケーリング制御

制御方法	実装箇所	設定値（目安）
SQS MaxReceiveCount	SQS キュー設定	3〜5回（リトライ上限）
ECS タスク数上限	ECS サービス設定	最大並行Worker数
Lambda 同時実行上限	Lambda 設定	{peak TPS} × {avg duration}
レートリミット	API Gateway / アプリ層	{要件値} req/sec per account

Job Api Design

ジョブ処理 API 詳細設計スキル

Steps

Step 1: 入力を読み込み、ジョブ処理要素を抽出する

Step 2: ジョブスキーマを定義する

Job Api Design

ジョブ処理 API 詳細設計スキル

Steps

Step 1: 入力を読み込み、ジョブ処理要素を抽出する

Step 2: ジョブスキーマを定義する

Step 3: ジョブステータス管理を定義する

Step 4: ジョブ API エンドポイントを定義する

Step 5: キュー設計を定義する

Step 6: Worker 設計を定義する

Step 7: リトライ・DLQ・エラーハンドリング方針を定義する

Step 8: スケジューリング設計を定義する（定期実行がある場合）

Step 9: モニタリング・アラート設計を定義する

Step 10: 環境変数・設定値一覧を作成する

Step 11: 08.job-api-design.md を出力する

Output Template

08.job-api-design.md

Quality Checklist

出力場所

My Workflow

Create Instructions

Init

Everything Claude Code Conventions

Codebase Onboarding

Ui Demo

エラー種別	リトライ対象	リトライ戦略	上限回数
外部 API 一時障害（5xx, timeout）	✅	指数バックオフ（1s → 2s → 4s）	3回
バリデーションエラー（4xx）	❌	即座に DEAD へ	—
DB 接続エラー	✅	一定間隔（5秒）リトライ	5回
OOM / プロセスクラッシュ	✅（SQS自動再配信）	SQS の可視性タイムアウト後に再配信	MaxReceiveCount

方式	使用サービス	適用場面
時刻指定実行（Cron）	EventBridge Scheduler	毎日/毎時の定期バッチ
遅延実行（Delay）	SQS DelaySeconds / DB polling	N分後に実行
特定日時実行	EventBridge Scheduler または jobs.scheduled_at	予約送信等

メトリクス	収集元	アラート閾値（目安）	アクション
SQS ApproximateNumberOfMessages	SQS	> {backlog上限}	Slack通知 / Worker スケールアウト
SQS ApproximateAgeOfOldestMessage	SQS	> {SLO秒数}	PagerDuty / Slack 緊急通知
DLQ NumberOfMessagesSent	SQS (DLQ)	> 0	Slack通知（ジョブ失敗検知）
Worker エラー率	Lambda / ECS カスタムメトリクス	> 5%	Slack通知
ジョブ処理時間（P95）	カスタムメトリクス	> {SLO秒数}	Slack通知
DEAD ステータスジョブ数	DB / Lambda カスタムメトリクス	> 0	Slack通知

SLO 指標	目標値	計測方法
ジョブ開始遅延（QUEUED → RUNNING）	< {N} 秒	jobs テーブルの started_at - created_at
ジョブ完了率（成功 / 全件）	> 99.X%	COMPLETED / (COMPLETED + DEAD)
P95 処理時間	< {N} 秒	completed_at - started_at の P95