小米 – 语言大模型算法工程师实习生 职位分析和面试指导

职位描述:

工作内容:语言大模型技术的研究和应用
负责大模型方向技术的研究和应用,构建大规模通用智能系统,工作内容包括以下三个方向:
a. 负责追踪大模型学术进展,预研前沿技术问题,打造行业领先技术影响力;
b. 负责根据业务场景,抽象技术问题,建立大模型智能体解决方案;
c . 负责将解决方案落地应用在具体业务场景,打造卓越的用户体验。
技术方向包括但不限于:
1. 全量微调、高效微调、模型评估及迭代;
2. 知识增强、工具增强、AI Agent、拟人化;
3. 幻觉、安全、时效性等问题解决;
4. 大模型核心能力提升,包括理解能力、知识能力、推理能力、生成能力和语言能力等。

职位要求:

1. 计算机相关专业获得硕士及以上学位, 发表过自然语言处理/大模型相关研究AI顶会论文优先;
2. 掌握NLP主流大模型,如GPT3/T5/PaLM/LLaMA/GLM等的原理,并对差异有深入的理解;
3. 熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed等多机多卡方案,有大模型训练和项目经验优先;
4. 有良好的代码开发能力,有开源项目开发经验优先。

招聘部门:

小米

工作地点:

武汉市

面试建议:

这个语言大模型算法工程师实习生的职位非常注重应聘者在NLP和大模型领域的技术深度和实践经验。从职位描述可以看出,小米不仅要求候选人掌握主流大模型的原理和差异,更需要具备将这些技术应用到实际业务场景的能力。特别值得注意的是,公司明确列出了四个关键技术方向,包括模型微调、能力增强、问题解决和核心能力提升,这些都是面试中会重点考察的内容。 为了准备这个面试,建议你首先系统梳理自己在NLP和大模型领域的研究经历和项目经验。对于技术问题,要准备好详细解释主流大模型的架构差异、训练优化方法以及你在相关项目中的具体贡献。同时,要特别关注如何将大模型技术落地到实际业务场景的经验,这是小米非常看重的。如果你有AI顶会论文发表经历,一定要重点准备相关内容的讲解。在面试中,展示你对大模型前沿技术的理解和思考,以及解决实际问题的能力,会给面试官留下深刻印象。