01 — 岗位职责
- ▹开展纯文本/多模态大模型的预训练与持续预训练
- ▹主导 SFT、RLHF、DPO 等对齐算法的研发与迭代
- ▹训练语料的构建、清洗与配比设计
- ▹模型评测体系搭建与能力分析
- ▹跟踪开源前沿(Qwen / GLM / DeepSeek / LLaMA)并复现
02 — 能力要求
熟练 PyTorch 与 Transformer 原理分布式训练(DeepSpeed / Megatron-LM)LoRA / QLoRA / PEFT 等参数高效微调数据工程与清洗管线CUDA 与算子基础
03 — 面试考点
Transformer 与注意力机制细节
预训练数据配比与清洗策略
RLHF 与 DPO 的区别与取舍
涌现能力的成因
长上下文与外推方案
MoE 混合专家架构
04 — 岗位速写
大模型算法工程师是 2026 年 AI 核心技术岗中薪资天花板最高的方向。其工作围绕”让模型更强”展开——从预训练语料的配比,到 SFT/RLHF/DPO 的对齐打磨,再到评测体系的反复验证。
这个岗位要求对 Transformer 有近乎肌肉记忆的理解,并能紧跟开源生态(Qwen、GLM、DeepSeek、LLaMA)的快速迭代。面试中,数据、对齐、推理优化三块往往是拉开差距的关键。