Generate structured Japanese vocabulary JSON data via Gemini API. Use when: creating word data, building vocab database, batch generating 单词数据, adding new Japanese words to the app.
批量生成结构化日语单词 JSON 数据,通过 Gemini API 产出包含 9 大维度的详尽词条信息,供 BreezeJP App 使用。
Python 虚拟环境已激活(项目根目录 .venv)
google-generativeai 已安装:
pip install -U google-generativeai
环境变量 GEMINI_API_KEY 已设置:
# 临时设置(当前终端会话有效)
export GEMINI_API_KEY="你的密钥"
# 或写入 ~/.zshrc 永久生效
echo 'export GEMINI_API_KEY="你的密钥"' >> ~/.zshrc
密钥获取:
脚本已根据免费层配额进行优化。每次执行前会自动检查:
| 限制 | 值 | 脚本策略 |
|---|---|---|
| RPM (请求/分钟) | 15 | 批大小=3,间隔=5.5s → 约11 RPM |
| TPM (Token/分钟) | 250K | 每请求≈8250 tokens → 约123K/min |
| RPD (请求/天) | 500 | 最关键,单日最多 1500 词 |
⚠️ 关键限制:每日最多处理 ~1450 个单词(500 请求 × 3 词/批)。超过此数字需要分多天处理。
files/单词生成器/
├── 单词源/ ← 输入文件放这里(纯文本,逗号分隔的日语单词)
└── 输出结果/ ← 生成的 JSON 自动保存在这里
在 files/单词生成器/单词源/ 下新建一个文本文件,文件名自定义(如 n3_verbs.txt),内容为英文逗号分隔的日语单词:
間に合う,適当,妥協,把握,皮肉,貢献
如果用户没有提供文件,询问:
使用 skill 内置的 生成脚本 批量生成:
cd /Users/summer/work/money/breeze_jp
source .venv/bin/activate
python .agents/skills/japanese-vocab-generator/scripts/generate_vocab.py \
--input files/单词生成器/单词源/n3_verbs.txt
关键参数:
--input:必填,单词源文件路径(相对项目根目录或绝对路径)gemini-3.1-flash-lite-preview,temperature=0.2脚本运行完成后,JSON 文件自动保存至:
files/单词生成器/输出结果/{输入文件名}_{timestamp_ms}.json
例如输入文件为 n3_verbs.txt,输出为 n3_verbs_1743000000000.json。
检查输出文件:
如果用户要求验证数据质量,检查以下要点:
[假名] ruby4_conjugations)是否完整6_example_sentences)是否包含 3 个等级7_synonyms_and_antonyms)是否详细每个单词生成包含 9 个维度的 JSON 对象:
| 字段 | 内容 |
|---|---|
1_basic_info | 单词、读音、罗马音、声调、JLPT等级、词性、自他动词 |
2_meanings_and_nuance | 多个中文释义 + 语感场景说明 |
3_critical_grammar_rules | 常搭配助词及用法解释 |
4_conjugations | 基本形、ます形、ない形、て形、た形、可能形、受身形、使役形 |
5_kanji_components | 每个汉字的音读、训读、核心本意 |
6_example_sentences | 口语/礼貌体/敬语 三个等级的例句 |
7_synonyms_and_antonyms | 近义词(含差异说明)+ 反义词 |
8_collocations_and_phrases | 高频固定搭配 |
9_common_mistakes_and_usage_notes | 中文母语者常犯错误及避坑说明 |
输出 JSON 中所有日文汉字必须使用 [假名] 格式标注:
一生懸命[いっしょうけんめい]気[き]づく