职位描述:
1. 针对研产供场景,全流程分析建模,建设并迭代AI模型,应用于设计研发、生产制造和供应链管理等领域,提升整体效率。
2. 大模型训练、对齐相关工作,包括不限于思维链数据构造、模型构造优化、模型训练评估等。
3. 结合实际场景,提供全面的技术解决方案,参与PE、推理优化、数据飞轮建设,提升大模型在应用场景的效果。
4. 开发和集成多模态数据处理技术,包括图像、文本、音频等,提升系统的感知和理解能力。构建跨模态数据融合框架,解决复杂业务场景下的信息提取和分析问题。
5. 协助开发和优化 AI Agent 的数据采集、分析及数据闭环相关工具,支持标注工具、研发工具、数据分析与可视化系统的设计与实现,提升产研团队的工作效率
6. 将AI模型集成到现有的设计研发、生产制造和供应链管理系统中,确保无缝对接和高效运行。协同其他技术团队,优化整体系统架构,提升系统的可扩展性和鲁棒性。
7. 跟踪和研究最新的AI技术和趋势,撰写技术报告,参与学术会议和技术交流,提升公司在行业内的技术影响力。
职位要求:
1. 本科及以上学历,计算机、人工智能、自动化、数学专业优先;
2. 对大模型的底层原理有基本理解,能跟踪语言模型和多模态领域的最新技术动向;
3. 扎实的编程基础,对数据结构、算法设计基础有深度了解,熟练掌握Python/C++等主流语言一种或多种,熟练应用pytorch、megatron、deepspeed、huggingface、transformers等深度学习框架和库;
4. 熟悉SFT、HFRL、GRPO等方法框架,能基于实际业务问题,设计合理、高效的垂类模型post training流程
5. 具备强大的工程/算法能力,能迅速迁移过往的工程/算法经验,深入理解系统底层原理并进行系统优化,能快速学习新知识;
6. 有ACM/IOI/NOI/Top Coder等算法竞赛获奖经历优先;
7. 深入理解 NLP、CV 等机器学习领域的知识,拥有文本、图像/视频生成或AIGC领域丰富实操经验,以及聊天机器人优化经验优先;
8. 熟悉大模型相关研究的前沿进展,能快速复现业界最新研究成果,有顶会论文、ACM等编程竞赛获奖者优先。
9. 责任心强,积极主动,有良好的沟通和合作能力,主动推动业务落地。
招聘部门:
小米
工作地点:
北京市 ID:A138012
面试建议:
面试小米的大模型算法-研产供岗位,你需要展示出在大模型训练、对齐及多模态数据处理技术方面的深厚功底。这个职位不仅要求你具备扎实的算法和工程能力,还需要你能将这些技术应用到实际的生产制造和供应链管理场景中,提升整体效率。面试官会特别关注你在多模态数据处理和大模型优化方面的实际经验,以及你如何将这些技术落地到复杂业务场景中。 为了准备这场面试,建议你重点复习大模型训练和对齐的相关技术,尤其是思维链数据构造和模型优化方法。同时,准备一些你在多模态数据处理和跨模态融合方面的实际案例,展示你如何解决复杂业务问题。此外,面试官可能会考察你对最新研究进展的了解,所以建议你提前阅读相关顶会论文,并准备好讨论你复现或改进这些研究成果的经验。最后,别忘了强调你的工程能力和团队协作精神,因为这是一个需要跨部门合作的职位。
在线咨询
请输入您的问题:
提示:由 AI 生成回答,可能存在错误,请注意甄别。