职位描述:
1、基于RISC-V计算架构、并行计算架构,负责设计、开发、优化底层算子库,提升底层芯片执行性能;
2、研究和探索LLM大模型、扩散模型等前沿深度学习算法在先进计算架构芯片上的优化算法,通过算法优化和硬件优化结合,实现更高的算法性能。
职位要求:
1、具备较强的工程能力,熟悉C/C++/Python,熟悉tensorflow/pytorch/onnx主流AI框架;
2、深入了解常见的LLM大模型,例如GPT、BERT、LLAMA等,理解内部模型结构原理和优化方法,具备相应的实践经验;
3、具备在CUDA/cuDNN/TensorRT/nccl等高性能库上实现和优化高性能算子的开发经验;
4、熟悉并行/异构计算体系结构,熟悉CPU/GPU/NPU/TPU等主流XPU架构和编程模型优先;
5、在AI相关顶刊顶会发表论文者更优;
6、良好的团队沟通能力、技术攻关能力,能独立思考和解决问题,责任心强,工程师素养佳。
招聘部门:
小米
工作地点:
上海市、北京市、西安市社招全职职位 ID:C1239
面试建议:
这个职位是小米公司针对智能方向的高级研发岗位,核心要求集中在RISC-V架构和LLM大模型优化这两个前沿技术领域。面试官会特别关注候选人在底层计算架构优化和大模型算法优化方面的实际经验,这不仅仅是理论知识的考察,更重要的是看候选人是否具备将这些技术落地到实际产品中的能力。 建议候选人重点准备三个方面:一是详细梳理自己在RISC-V架构或类似计算架构上的开发经验,特别是性能优化方面的案例;二是针对LLM大模型,不仅要准备模型原理的解释,更要准备自己在模型优化方面的具体实践,比如如何减少推理延迟、降低内存占用等;三是准备好高性能计算相关的开发经验,特别是CUDA优化方面的实际案例。同时,建议携带能展示自己技术能力的代码片段或项目文档,这在技术面试中往往能起到关键作用。