Name: Excel Template Contract Fill
Author: cx-qk

Excel Template Contract Fill

把四大期货交易所(上期所/大商所/郑商所/广期所)的原始行情和合约参数文件整理成统一模板,输出到「合约数据(整理后)/」。本 skill 给的是"如何语义化识别数据"的规则,而不是某个固定脚本——目的是让任何 AI(Claude / Kimi / GLM 等)按这些规则都能跑出一致的结果,即使交易所改了列名、调了顺序、或新增了品种,也能自愈。触发词:整理合约数据、填模板、转换原始数据、/convert-raw-futures-to-template。

cx-qk2 estrellas11 abr 2026

Ocupación
Categorías: Documentos

这个 skill 为什么不只是一个脚本

交易所的原始文件迟早会变:列被重命名、顺序被打乱、子表头被换掉、新品种被挂出来。如果 skill 只说"运行 xxx.py",那一旦格式变了脚本就废了,而且换一个 AI(Kimi/GLM)又得重新对齐。

所以本 skill 的核心是 语义规则,不是一段代码:

描述每一列"应该长什么样"——而不是"在第几列"
描述每种来源文件的"结构指纹"——让 AI 在文件名被乱改时也认得出
描述每个字段"缺了还能从哪里补"——而不是缺了就报错
描述"自检要看什么"——而不是死扣某天的行数

任何 AI 按本文档的规则去做,都应该能写出一份等价的转换脚本。

tools/convert_raw_futures_to_template.py 只是一个 参考实现,对应的是 2026-04 看到的那种格式快照。如果今天跑挂了,修脚本 > 让 AI 自己凑数据;如果你不是 Claude,可以照着本 SKILL 的规则重写一份等价脚本。

最终要产出什么

输出目录:合约数据(整理后)/

文件	内容
`上期所.xlsx`	sheet `数据`(模板 7 列) + sheet `映射表`(字段级来源说明)
`大商所.xlsx`	同上
`郑商所.xlsx`	同上

Excel Template Contract Fill

cx-qk2 estrellas11 abr 2026

Ocupación
Categorías: Documentos

这个 skill 为什么不只是一个脚本

所以本 skill 的核心是 语义规则,不是一段代码:

描述每一列"应该长什么样"——而不是"在第几列"

描述每种来源文件的"结构指纹"——让 AI 在文件名被乱改时也认得出

描述每个字段"缺了还能从哪里补"——而不是缺了就报错

描述"自检要看什么"——而不是死扣某天的行数

任何 AI 按本文档的规则去做,都应该能写出一份等价的转换脚本。

文件

内容

上期所.xlsx

sheet 数据(模板 7 列) + sheet 映射表(字段级来源说明)

大商所.xlsx

同上

郑商所.xlsx

同上

# SHFE_PRODUCTS: 中文品种名 -> (品种前缀, 每手数量) # 例如: "铜" -> ("cu", 5), "黄金" -> ("au", 1000), "SCFIS欧线" -> ("ec", 50) SHFE_PRODUCTS = { "铜": ("cu", 5), "铝": ("al", 5), "锌": ("zn", 5), "铅": ("pb", 5), "镍": ("ni", 1), "锡": ("sn", 1), "铸造铝合金": ("ad", 10), "黄金": ("au", 1000), "白银": ("ag", 15), "螺纹钢": ("rb", 10), "线材": ("wr", 10), "热轧卷板": ("hc", 10), "不锈钢": ("ss", 5), "氧化铝": ("ao", 20), "燃料油": ("fu", 10), "石油沥青": ("bu", 10), "天然橡胶": ("ru", 10), "丁二烯橡胶": ("br", 5), "纸浆": ("sp", 10), "胶版印刷纸": ("op", 40), "原油": ("sc", 1000), "低硫燃料油": ("lu", 10), "20号胶": ("nr", 10), "铜(BC)": ("bc", 5), "SCFIS欧线": ("ec", 50), } current_product = None # 正在解析的品种(中文) for row in rows[3:]: # 跳过标题 + 说明 + 表头 cell0 = str(row[0] or "").strip() # ① 品种段起始:"商品名称:铜" if cell0.startswith("商品名称"): name = cell0.split(":", 1)[1].strip() if ":" in cell0 else cell0.replace("商品名称", "").strip() current_product = name if name in SHFE_PRODUCTS else None continue # ② 品种段结束:小计 / 合计 → 清空 current_product,避免串到下一个品种 if cell0 in ("小计", "合计") or cell0.startswith("小计"): current_product = None continue # ③ 跳过子品种(不是独立合约) if current_product and "TAS" in cell0.upper(): # 原油TAS continue if current_product and "期转现" in cell0: # 铜期转现 continue # ④ 合约月份行:cell0 形如 "2604" / "2605" / ... if current_product and cell0.isdigit() and len(cell0) in (3, 4): prefix, lot = SHFE_PRODUCTS[current_product] contract_code = f"{prefix}{cell0}" # ← 必须在这里拼!cu + 2605 = cu2605 close_price = pick_first_nonzero(row[5], row[6], row[1]) # 收盘价 > 结算参考价 > 前结算 open_interest = to_int(row[11]) yield { "合约代码": contract_code, "商品名称": current_product, "交割月": parse_delivery(cell0), # 2605 -> "2026-05" "收盘价": close_price, "持仓量": open_interest, "_lot": lot, "_product_cn": current_product, }

交易所	行情侧指纹(任一命中即可)	合约信息侧指纹(任一命中即可)
上期所	前 15 行含 `上海期货交易所` / `商品名称:铜` 这种品种段起始行 / `品种段` 文字	含 `一般持仓买保证金率` 列 / 表头第 2 行是 `合约代码`
大商所	首行中文标题含 `大连商品交易所`	含 `交易保证金(投机)金额` 或 `投机)金额` 列
郑商所	列名含 `今收盘` + `今结算` + `昨结算`(这个组合只有郑商所);或文件是 html 含 `郑州`	两行表头 + 含 `年份代码` + `月份代码` 列;文本文件
广期所	首行表头含 `品种` + `交割月份` + 只有 `lc / si / ps / pd / pt` 这 5 个品种	两行表头 + 含"投机买保证金率"列

输入形态	处理
`20.00%`(带百分号字符串)	去掉 `%`,再 ÷100
`0.20`(0~1 小数)	直接用
`15`(>1 数字)	÷100(按百分比理解)

维度	特征
行情结构	"品种段"格式:一行 `商品名称:铜`,后面跟 12 个月份行,再 `小计/合计` 表示该品种结束。下一行是 `商品名称:铝`...必须维护一个 `current_product` 状态变量,遇到小计就清空,否则会串品种
行情列布局	`[0]交割月份 [1]前结算 [2]今开盘 [3]最高价 [4]最低价 [5]收盘价 [6]结算参考价 [7]涨跌1 [8]涨跌2 [9]成交手 [10]成交额 [11]持仓手 [12]/变化`
行情里没有合约代码列	第 [0] 列是 `交割月份`(像 `2604`),不是合约代码!合约代码必须通过 `品种前缀 + 交割月份` 在解析时拼出来,见下方伪代码。
合约信息表头	在第 2 行:`合约代码 \| 一般持仓买保证金率(%) \| 一般持仓卖保证金率(%) \| 套保买 \| 套保卖 \| 涨停板 \| 跌停板`
子品种要跳过	`原油TAS`、`铜期转现`——它们是主品种的子场景,没有独立的合约参数,不跳过会产生孤儿行
容易踩坑的代码	`ad`=铸造铝合金(不是石油沥青!石油沥青是 `bu`)<br>`op`=胶版印刷纸<br>`bc`=铜(BC)<br>`nr`=20号胶

维度	特征
行情结构	首行是中文标题(`大连商品交易所_日行情_YYYYMMDD`),表头在第 2 行
合约信息特殊性	唯一直接给出"每手保证金金额"的交易所,优先直取,不要再算
合约代码特殊后缀	可以有 `F` 后缀(`l2605F`、`pp2605F`、`v2605F`),表示滚动交割合约,是合法数据,不要过滤掉
前缀匹配顺序	必须从长到短匹配,否则 `cs`(玉米淀粉)会被 `c`(玉米)抢走、`jm` 会被 `j` 抢走
易漏的新品种	`bz`(瓶片,15 吨/手)、`lg`(原木,90 立方米/手)

维度	特征
行情列布局	`合约代码 \| 昨结算 \| 今开盘 \| 最高价 \| 最低价 \| 今收盘 \| 今结算 \| 涨跌1 \| 涨跌2 \| 成交量(手) \| 持仓量 \| 增减量 \| 成交额(万元) \| 交割结算价`
行情没有品种列	商品名称只能从合约信息 CSV 取
合约信息表头	两行表头,真正数据从第 3 行开始
价格回退链必开	大量长尾合约 `今收盘=0.00`,不回退会丢 60+ 条
合约代码大小写	大写保留(`AP605`、`CF605`)
交易单位字段	文本(`10吨/手`),需要正则解析出数字

维度	特征
行情结构	表头在第 1 行:`商品名称 \| 交割月份 \| 开盘价 \| ...`
合约信息结构	两行表头(row1 主标题、row2 子标题),数据从第 3 行开始
投机买保证金率	在合约信息的第 9 列(0-index 8)
品种少	目前 5 个:`lc`(碳酸锂)、`si`(工业硅)、`ps`(多晶硅)、`pd`(钯)、`pt`(铂)。新品种出现时必须更新字典

品种	每手数量	单位
黄金 au	1000	克
白银 ag	15	千克
原油 sc	1000	桶
SCFIS 欧线 ec	50	元/点
螺纹钢 rb	10	吨

输入	期望输出
`1,234.56`	`1234.56`(去千分位)
`20.00%`	`0.20`(去 % 并 ÷100)
`-` / `—` / `–` / `n.a.` / `N/A` / `NA` / `''`	`None`
`0` / `0.00`	`0`(但价格场景下视为"无交易")

Excel Template Contract Fill

这个 skill 为什么不只是一个脚本

最终要产出什么

Excel Template Contract Fill

这个 skill 为什么不只是一个脚本

最终要产出什么

工作流程(四步)

Step 1 — 探测原始文件

① 扫描两个目录

② 按文件名成对(stem 匹配)

③ 对每一对做"内容嗅探",确定属于哪个交易所

跑完 Step 1 要产出的信息

Step 2 — 字段语义映射

Step 3 — 计算可计算字段

Step 4 — 自检

字段语义规则(核心)

1. 合约代码

2. 商品名称

3. 交割月

4. 收盘价(价格回退链 — 非常重要)

5. 持仓量

6. 最低保证金率

SHFE 专项 — 保证金率列名多级回退(必须照抄)

7. 最低保证金(核心字段)

交易所结构指纹

上期所(SHFE)

上期所行情解析伪代码(必须照做)

大商所(DCE)

郑商所(CZCE)

广期所(GFEX)

品种前缀字典

关于"每手数量"

发现新品种(字典里没有)怎么办

数字解析必须鲁棒

自检规则(每次跑完必做)

🛑 硬失败检查(必须 assert / raise,不满足就中止,不能静默写空表)

软检查(写完文件后人工或脚本 warn)

禁止事项

参考实现

修改本 skill 的时机

Feishu Doc

Summarize

Nano Pdf

Diffs

Customs Trade Compliance

Nutrient Document Processing