Name: Product Chart Get
Author: aimentorai

Product Chart Get（选品下载与复筛）

目标

通过命令行调用 MCP 的 tmallGeniePageQuery 获取原始产品数据
通过 AI 语义处理：中文标题翻译、复筛判断、季节性识别
生成两份 Excel：完整选品表 + 复筛通过表
累积记录已排查的剔除产品，避免重复

快速开始

标准流程（推荐）

# Step 1: 命令行获取原始数据（通过 mcporter）
python3 scripts/fetch_raw_data.py --date 20260407 --page 1 --size 20

# Step 2: AI 读取 mini_products-第1页.json 进行复筛处理
# （在 Claude 对话中完成，告诉 AI 读取该文件）

# Step 3: 脚本合并生成 Excel
python3 scripts/generate_excel.py --date 20260407

常用命令示例

# 获取 20 条数据（推荐，避免上下文过大）
python3 scripts/fetch_raw_data.py --date 20260407 --page 1 --size 20

# 获取 50 条数据（标准量）
python3 scripts/fetch_raw_data.py --date 20260407 --page 1 --size 50

# 快速测试 5 条
python3 scripts/fetch_raw_data.py --date 20260407 --page 1 --size 5

Product Chart Get（选品下载与复筛）

目标

通过命令行调用 MCP 的 tmallGeniePageQuery 获取原始产品数据
通过 AI 语义处理：中文标题翻译、复筛判断、季节性识别
生成两份 Excel：完整选品表 + 复筛通过表
累积记录已排查的剔除产品，避免重复

快速开始

标准流程（推荐）

# Step 1: 命令行获取原始数据（通过 mcporter）
python3 scripts/fetch_raw_data.py --date 20260407 --page 1 --size 20

# Step 2: AI 读取 mini_products-第1页.json 进行复筛处理
# （在 Claude 对话中完成，告诉 AI 读取该文件）

# Step 3: 脚本合并生成 Excel
python3 scripts/generate_excel.py --date 20260407

常用命令示例

# 获取 20 条数据（推荐，避免上下文过大）
python3 scripts/fetch_raw_data.py --date 20260407 --page 1 --size 20

# 获取 50 条数据（标准量）
python3 scripts/fetch_raw_data.py --date 20260407 --page 1 --size 50

# 快速测试 5 条
python3 scripts/fetch_raw_data.py --date 20260407 --page 1 --size 5

环节	负责方	说明
数据获取	脚本 (fetch_raw_data.py)	通过 mcporter 调用 MCP，解析原始数据
语义处理	AI	读取精简数据文件，输出中文标题、复筛、季节性
Excel 生成	脚本 (generate_excel.py)	合并原始数据 + AI 结果，生成 Excel

文件	大小(20条)	说明
`data-get-第1页数据-原始文本.txt`	~40KB	mcporter 原始输出
`data-get-第1页数据.json`	~46KB	完整 JSON（所有字段，永久保留）
`mini_products-第1页.json`	~32KB	AI 复筛专用

参数	说明	默认值
`--date` / `-d`	数据日期 (YYYYMMDD)	必需
`--page` / `-p`	页码	1
`--size` / `-s`	每页条数 (1-50)	20
`--output` / `-o`	输出目录	`{WORKSPACE}/{date}选品/`

MCP 参数	来源
`ds`	`--date`
`current`	`--page`
`size`	`--size`

文件	用途	生命周期
`YYYYMMDD选品.xlsx`	完整产品列表	保留
`YYYYMMDD选品复筛.xlsx`	供应商查询表	保留
`data-get-第N页数据.json`	原始完整数据	永久保留，可追溯
`mini_products-第N页.json`	AI 输入数据	处理后可删除
`ai_results.json`	AI 复筛结果	合并后可删除
`已排查产品.xlsx`	负面清单	永久累积追加

Product Chart Get

Product Chart Get（选品下载与复筛）

目标

快速开始

标准流程（推荐）

常用命令示例

Product Chart Get

Product Chart Get（选品下载与复筛）

目标

快速开始

标准流程（推荐）

常用命令示例

核心分工

执行流程详解

Step 1：命令行获取原始数据

Step 2：AI 语义处理

Step 3：生成 Excel

输入参数

fetch_raw_data.py 参数

MCP 参数映射

输出文件

文件位置

文件说明

AI 处理规则

中文标题规则

复筛规则

季节性规则

ai_results.json 格式

目录命名规则

常见问题

脚本参数

fetch_raw_data.py

generate_excel.py

Ordercli

Paypal Integration

Stripe Integration

Billing Automation

Odoo Ecommerce Configurator

Odoo Shopify Integration

条件	剔除范围	不剔除示例
消耗品	一次性塑料（杯、叉、吸管等）	PVC 桌垫、塑料收纳箱
液体/粉末	洗发水、精华液、洗碗液等	容器、防液功能描述
带电设备	LED灯、充电宝、电动玩具等	电子支架、非功能性装饰
受限品类	食品、婴儿、医疗、玩具	toy storage（收纳用途）

节日	旺季月份
Christmas/Advent	12
Halloween	10
Easter	3-4
Valentine's Day	2
New Year	12-1
Thanksgiving	11
Mother's Day	5
Father's Day	6

用户指令	目录名	数据日期(ds)	说明
"生成选品表"	`20260406选品/`	20260406	用昨天
"生成20260328选品表"	`20260328选品/`	20260328	明确指定日期
"生成第2页"	同上日期	同上	日期从用户指令推导