职位简介:
作为AI搜索算法工程师(大模型后训练方向),你将负责AI搜索中大模型后训练方向的核心技术研发、优化与创新,优化Post-training算法的训练效率和回复效果,并研究各领域高质量数据的自动化合成方法,建设高效的线上数据飞轮链路。同时,你需要跟踪AI搜索领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用,并参与产品讨论,基于技术对产品提出改进建议。该职位要求计算机科学、人工智能等相关专业硕士及以上学历,具备良好的LLM技术基础,熟练使用深度学习训练和推理框架,深入理解Transformer、GPT等模型架构,并在Post-training方向有一定研究基础,熟悉SFT/DPO/PPO/GRPO/Reward Model等及数据合成技术,具备良好的分析和解决问题的能力,针对具体的应用场景能合理设计和优化算法并应用,有相关领域顶会论文者优先。工作地点为北京。
简历及面试建议:
在撰写简历时,你需要突出你在AI搜索和大模型后训练方向的技术背景和实践经验。首先,确保你的教育背景部分明确列出计算机科学或人工智能相关专业的硕士及以上学历,这是腾讯对该职位的基本要求。其次,在专业技能部分,重点展示你对Transformer、GPT等模型架构的深入理解,以及你在SFT、DPO、PPO、GRPO、Reward Model等后训练技术方面的熟练程度。如果你有使用深度学习训练和推理框架的经验,务必详细描述,包括具体的框架名称和项目中的应用场景。此外,如果你在数据合成技术方面有研究或实践经验,也要在简历中突出体现,这是该职位的核心要求之一。在项目经验部分,选择与AI搜索或大模型后训练相关的项目进行详细描述,尤其是那些能够展示你算法优化和创新能力的项目。如果你有相关领域的顶会论文,一定要在简历中明确列出,并简要说明论文的主要贡献和创新点。最后,不要忘记展示你分析和解决问题的能力,可以通过具体的案例来说明你是如何针对应用场景设计和优化算法的。
在面试准备阶段,你需要深入理解大模型后训练技术和AI搜索领域的前沿算法。首先,复习Transformer、GPT等模型架构的核心原理,确保你能够清晰地解释这些模型的优缺点及其在后训练中的应用。其次,准备一些具体的案例来展示你在SFT、DPO、PPO、GRPO、Reward Model等后训练技术方面的实践经验,包括你在项目中如何优化训练效率和回复效果。面试官可能会问到你如何设计和实现数据合成技术,因此你需要准备一些具体的例子来说明你的方法和成果。此外,面试中可能会涉及算法设计和优化的问题,你需要展示你的分析和解决问题的能力,可以通过模拟面试来练习如何清晰地表达你的思路和方法。如果你有相关领域的顶会论文,准备好详细讨论论文的研究背景、方法、实验和结论,并能够回答面试官可能提出的技术细节问题。最后,面试中可能会问到你对AI搜索领域前沿技术的看法,因此你需要提前了解最新的研究进展和技术趋势,并准备一些有见地的观点和讨论。
在线咨询
提示:由 AI 生成回答,可能存在错误,请注意甄别。