小米 – 大模型高性能优化工程师 职位分析和面试指导

职位描述:

1. 负责大模型团队深度学习、大模型算法在NVIDIA GPU平台部署优化
2. 高质量地完成推理代码编写与SDK封装,将算法落地到汽车、手机、小爱等集团业务线
3. 充分挖掘GPU算力,计算热点分析,优化资源占用,极致优化推理性能
4. 负责AI项目交付、日常维护、技术文档撰写等工作

职位要求:

1. 本科及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业
2. 掌握Python、C、C++等编程语言,精通数据结构算法,具备优秀的编程习惯
3. 了解CNN、LLM、Transformer、Diffusion等算法原理
4. 熟悉常见深度学习或LLM推理框架,如:TensorRT、TensorRT-LLM、llama.cpp、one-diff等
5. 对模型量化、定点化、低比特表示有深入研究和理解
6. 有CUDA、PTX指令编程经验,对高性能计算感兴趣者优先
7. 加分项:阅读过任意一种推理框架源码

招聘部门:

小米

工作地点:

北京市 ID:A44711

面试建议:

这个职位是小米公司大模型团队的高性能优化工程师,核心在于将大模型算法高效部署到实际业务场景中。不同于一般的算法工程师,这个岗位更注重工程实现和性能优化能力。面试官会特别关注你在GPU平台上的优化经验,以及将算法落地的实战能力。 建议你在准备面试时,重点梳理在GPU优化方面的项目经验,特别是使用TensorRT等框架进行推理优化的案例。准备好解释你在模型量化、低比特表示等关键技术上的理解。对于CUDA编程,可以准备一些性能调优的具体例子。由于岗位涉及多个业务线落地,也要准备好展示你的跨团队协作能力和文档撰写能力。记得带上你的代码样本或优化前后的性能对比数据,这会大大增加说服力。

在线咨询


请输入您的问题:

提示:由 AI 生成回答,可能存在错误,请注意甄别。