根据车型名称查找并提取汽车之家与懂车帝的车型编号(seriesId)及对应车型页 URL。适用于用户只给自然语言车型名、需要定位汽车之家/懂车帝车型链接、需要从链接中提取编号,或要为后续口碑采集、车型页抓取、批量数据任务先做车型 ID 定位时使用。尤其在用户提到“车型编号”“seriesId”“汽车之家链接编号”“懂车帝链接编号”“先查车型 URL/ID”时使用。
目标:当用户只给车型名时,先帮他定位该车型在汽车之家和懂车帝的车型页,再提取 URL 中的编号。
https://www.autohome.com.cn/<seriesId>/https://www.dongchedi.com/auto/series/<seriesId>车型名 + 站点 + 编号 + 可验证 URL如需确认站点 URL 规则,读:references/sites.md
保留用户原词,不要自作主张改成别的车。
但可以做轻量兼容:
PLUS / Pro / EV / DM / i / L 等后缀优先同时查询:
当前推荐查询策略:
k.autohome.com.cn 口碑域名/auto/series/<id>默认优先使用附带的浏览器脚本:
node skills/vehicle-id-finder/scripts/find_vehicle_ids_playwright.js --json "风云X3PLUS"
若当前环境访问站点需要代理,可先设置:
export PLAYWRIGHT_PROXY_SERVER=http://127.0.0.1:7890
node skills/vehicle-id-finder/scripts/find_vehicle_ids_playwright.js --json "风云X3PLUS"
如果只想做轻量实验,再用 Python 版原型:
python3 skills/vehicle-id-finder/scripts/find_vehicle_ids.py "风云X3PLUS" --json
提取规则:
/12345/ 中的数字https://k.autohome.com.cn/<seriesId> 或 https://k.autohome.com.cn/<seriesId>/<specId> 里的前半段 <seriesId>spec 页:https://k.autohome.com.cn/spec/<specId>/ 里的 <specId> 只能当候选验证页,不能直接当 seriesId/auto/series/12345 中的数字汽车之家专项规则:
seriesId 时,优先走 k.autohome.com.cn 链路site:k.autohome.com.cn <车型名>k.autohome.com.cn/<seriesId>/<specId> 这类 URL,优先取前半段 <seriesId> 作为结果k.autohome.com.cn/spec/<specId>/,先把它当作“车型命中证据”,再继续反查或补查 seriesIdseriesId 反查出来,流程才算完成;不能只返回 specId,也不能只汇报“命中了 spec 页”seriesId 时,优先继续寻找同车型的 k.autohome.com.cn/<seriesId> 或 k.autohome.com.cn/<seriesId>/<specId> 口碑链路;若拿到后者,取前半段 <seriesId>seriesId;除非多轮校验后仍失败,才允许回复“暂未找到 seriesId,但已命中这个 spec 页作为候选证据”seriesId,必须补一轮直链确认:访问 https://k.autohome.com.cn/<seriesId>?dimensionid=10&order=0&yearid=0#listcontainer,确认页面标题或正文明确包含目标车型名seriesId 作为正式结果输出懂车帝专项规则:
site:dongchedi.com/auto/params <车型名>site:dongchedi.com <车型名> 口碑site:dongchedi.com <车型名> 评价PLUS / PRO / MAX / EV / DM / L 这类后缀,建议同时保留原词和“补空格后的变体”一起查询,例如:风云X3PLUS 与 风云X3 PLUShttps://www.dongchedi.com/auto/params-carIds-x-<id>,可将 <id> 当作高价值候选,但仍需回填验证 /auto/series/<id>https://www.dongchedi.com/community/<id> 或 /community/<id>/wenda,可将 <id> 当作候选 seriesId,再回填验证 /auto/series/<id>/auto/series/<id> 页面标题或正文明确命中目标车型名时,才把该 <id> 作为正式结果输出已验证可行的经验:
site:k.autohome.com.cn 风云X3PLUS 比 site:autohome.com.cn 风云X3PLUS 更容易命中汽车之家口碑域名k.autohome.com.cn/<seriesId>/<specId> 这种结果对提取汽车之家 seriesId 很有价值k.autohome.com.cn/spec/<specId>/ 往往能证明车型命中,但不等于最终要交付的 seriesIdcommunity/<id> 与 /auto/series/<id> 可以属于同一主 ID 体系params-carIds-x-<id> 对某些车型比“口碑”查询更直接,但必须做车型文本过滤与 /auto/series/<id> 回填校验校验规则:
默认输出示例:
https://k.autohome.com.cn/8089?dimensionid=10&order=0&yearid=0#listcontainerhttps://www.dongchedi.com/auto/series/25398如果某一站没找到,明确说“未找到”,不要补猜测编号。
汽车之家输出时,如果当前拿到的是口碑链路结果,优先给 seriesId,不要把 specId 冒充成汽车之家 seriesId。
出现下面这类需求时,用本 skill:
scripts/find_vehicle_ids_playwright.js用途:
PLAYWRIGHT_PROXY_SERVER 或 HTTP_PROXY/HTTPS_PROXY 走代理示例:
node skills/vehicle-id-finder/scripts/find_vehicle_ids_playwright.js --json "风云X3PLUS"
scripts/find_vehicle_ids.py用途:
PLUS / PRO / MAX / EV / DM 这类后缀时,宁可保守也别瞎对号入座seriesId 和 specId 不是一回事;当前 skill 面向口碑采集时要的是 seriesIdspec 页,最多说明“车型命中了”,还不能直接宣布已拿到 seriesIdseriesId,默认做一次 k.autohome.com.cn/<seriesId>?dimensionid=10... 直链确认再输出