Name: Llm Infra Recruiter
Author: cmq2525

Llm Infra Recruiter

专为筛选大模型基础设施（LLM Infra）工程师简历设计。当用户需要评估国产算力方向的大模型训练/推理 Infra 候选人时使用此 skill。重点评估候选人在国产算力算子开发、分布式并行训练、RL 工程落地及性能分析等方向的经验，生成包含多维度评分、评分理由和潜在疑点的结构化评估报告。适用场景：用户上传简历文件（PDF/Word/文本）并要求筛选或评估大模型 Infra 候选人。

cmq25250 스타2026. 3. 19.

직업
카테고리: 머신러닝

大模型 Infra 工程师简历筛选 Skill

工作流程

按以下步骤依次执行，不得跳过：

解析简历：务必将简历附件转换为 Markdown 格式后，再进行后续分析。若为 PDF 格式，优先使用 shell 工具执行 pdftotext <path> - 提取文本；若 pdftotext 输出质量差（如乱码、内容缺失），则改用 file 工具的 view 功能进行多模态识别。将提取的内容整理为结构化文本后再进行后续分析。
执行评估：严格按照下方"评分标准"和"疑点检测"规则，对简历内容进行逐维度分析，给出初步评分。
交叉验证：对照原始 JD 要求（核心职责、任职要求、加分项），审查各维度评分的合理性：
- 检查是否存在简历亮点被低估（如 JD 明确要求"国产算力算子开发"或"HCCL/HCCS 调优"经验，但评分未充分体现）
- 检查是否存在简历短板被忽视（如 JD 要求"昇腾/沐曦/摩尔线程"实际开发经验，但候选人仅有 CUDA 经验）
- 检查加分项匹配度（如候选人具备 verl/slime/vllm 等 JD 明确提及的框架贡献，是否在评分中体现）
- 如有偏差，调整相应维度得分并说明调整理由
生成报告：严格按照下方"输出格式"生成最终的 Markdown 评估报告，并直接呈现给用户。

岗位背景

本 skill 针对以下类型的大模型 Infra 工程师岗位设计：

原始 JD 文件：llm_infra_engineer_jd.md

Llm Infra Recruiter

cmq25250 스타2026. 3. 19.

직업
카테고리: 머신러닝

工作流程

按以下步骤依次执行，不得跳过：

解析简历：务必将简历附件转换为 Markdown 格式后，再进行后续分析。若为 PDF 格式，优先使用 shell 工具执行 pdftotext <path> - 提取文本；若 pdftotext 输出质量差（如乱码、内容缺失），则改用 file 工具的 view 功能进行多模态识别。将提取的内容整理为结构化文本后再进行后续分析。

执行评估：严格按照下方"评分标准"和"疑点检测"规则，对简历内容进行逐维度分析，给出初步评分。

交叉验证：对照原始 JD 要求（核心职责、任职要求、加分项），审查各维度评分的合理性：

检查是否存在简历亮点被低估（如 JD 明确要求"国产算力算子开发"或"HCCL/HCCS 调优"经验，但评分未充分体现）
检查是否存在简历短板被忽视（如 JD 要求"昇腾/沐曦/摩尔线程"实际开发经验，但候选人仅有 CUDA 经验）
检查加分项匹配度（如候选人具备 verl/slime/vllm 等 JD 明确提及的框架贡献，是否在评分中体现）
如有偏差，调整相应维度得分并说明调整理由

生成报告：严格按照下方"输出格式"生成最终的 Markdown 评估报告，并直接呈现给用户。

分数	标准
5	有在国产算力上使用 TBE、Ascend C、tielang 等工具开发并上线核心算子（如 Attention、MoE、Flash Attention 变体等）的完整经验，能描述性能优化的具体手段和量化收益。
4	有在国产算力上开发算子的实际经验，能独立完成算子适配与调优，但涉及的算子类型或优化深度相对有限。
3	有在国产算力上使用相关工具的经验，但主要以适配已有算子为主，未涉及从零开发或深度性能优化。
2	有 CUDA 算子开发经验，但国产算力经验仅停留在环境搭建或简单调用层面，未涉及算子开发。
1	无国产算力实际开发经验，或简历中完全未提及相关内容。

分数	标准
5	深入参与过大规模模型（百亿参数以上）的分布式训练，主导过并行策略的设计与调优；有 HCCL/HCCS 实际调优经验，能定位并解决通信瓶颈，有量化的性能提升数据。
4	熟悉 Megatron/DeepSpeed 等框架，在生产环境中参与过分布式训练任务；了解 HCCL/HCCS 并有使用经验，能独立分析通信瓶颈。
3	了解分布式训练的基本原理和常见并行策略，有过使用 Megatron/DeepSpeed 的经历，但未涉及深度调优或大规模场景。
2	对分布式训练有概念性了解，有过单机多卡训练经验，但未涉及多机多卡或通信优化。
1	无分布式训练实际经验。

分数	标准
5	熟练使用 msprof 或同类工具进行系统级性能分析，有完整的"发现瓶颈→定位根因→优化验证"闭环经验，能描述具体的优化手段（如 kernel fusion、计算通信 overlap）和量化收益。
4	能使用性能分析工具定位常见瓶颈，有实际优化经验，但优化深度或系统性不足。
3	了解性能分析工具的基本使用方法，有过简单的性能调优经历。
2	对性能分析有概念性了解，但无实际工具使用经验。
1	简历中未体现性能分析与故障诊断相关经验。

分数	标准
5	C++/Python 功底扎实，有深入理解计算机体系结构（存储层次、指令流水、内存模型等）的项目经历；有主导改造大型训练框架或基础设施的经验。
4	C++/Python 基础良好，有在复杂系统中进行模块级开发或改造的经验，对体系结构有一定理解。
3	有 C++/Python 开发经验，能完成功能模块的开发，但缺乏系统级设计或体系结构深度。
2	以 Python 为主，C++ 经验有限，缺乏底层系统开发经验。
1	工程基础薄弱，缺乏 C++/Python 实际项目经验。

分数	标准
5	具备两项及以上加分项，且均有实际落地或贡献记录（如可查的 PR/commit 记录、具体模型规模数据）。
4	具备一项加分项，且有明确的实际落地或贡献记录。
3	具备一项加分项，但证据不够充分（如仅提及框架名称，无具体贡献细节）。
2	与加分项方向有一定关联，但未直接涉及（如有小规模 RL 实验经验，但未工程化落地）。
1	不具备任何加分项相关经验。

Llm Infra Recruiter

大模型 Infra 工程师简历筛选 Skill

工作流程

岗位背景

Llm Infra Recruiter

大模型 Infra 工程师简历筛选 Skill

工作流程

岗位背景

核心职责

评分标准

维度一：国产算力算子开发（权重 35%）

维度二：分布式并行训练与通信优化（权重 30%）

维度三：性能分析与故障诊断（权重 15%）

维度四：工程基础与系统能力（权重 10%）

维度五：加分项（权重 10%）

综合得分计算

疑点检测

输出格式

Continuous Learning V2

Continuous Learning V2

Continuous Learning V2

Continuous Learning

Continuous Learning

Pytorch Patterns