腾讯 – 腾讯游戏-AI算法研究员-LLM/强化学习方向(新星引力计划) 职位分析和面试指导

职位简介:

作为腾讯游戏AI算法研究员,你将负责基于LLM的智能体算法在游戏NPC和AI BOT等场景中的应用,并深入研究LLM训练算法包括SFT和RL,以及训练数据合成和自动评测相关算法,以提升LLM在复杂游戏场景中的多轮对话和推理规划能力。同时,你将探索基于LLM的检索增强和多智能体协作算法,推动其在游戏内相关场景的落地,并持续优化强化学习效率和效果,结合游戏场景进行创新应用。该职位要求硕士及以上学历,计算机、机器学习或数学等相关专业背景,1-3年大模型领域相关工作经验,掌握机器学习、强化学习和大模型算法原理,包括预训练、SFT、RLHF/DPO/PPO等,并有强化学习相关项目的深入落地应用经验,同时需要持续关注AI前沿技术动态,具备优秀的团队协作与沟通能力,能快速推动技术方案的场景适配与落地验证。

>> 在腾讯官网查看完整职位详情。

简历及面试建议:

在撰写简历时,你需要突出与大模型和强化学习相关的项目经验,尤其是那些在游戏场景中落地的案例。详细描述你在LLM训练算法(如SFT、RLHF/DPO/PPO)方面的实际应用经验,以及你在训练数据合成和自动评测算法上的贡献。如果你有基于LLM的智能体算法在游戏NPC或AI BOT中的应用经验,务必重点强调。此外,展示你在检索增强(RAG)和多智能体协作算法方面的研究成果,以及你在提升强化学习效率和效果上的创新方法。简历中还应体现你对AI前沿技术的持续关注和学习能力,以及你在团队协作和沟通方面的优势。通过具体的数据和成果来量化你的贡献,例如算法性能提升的百分比或项目落地的实际效果。

在面试中,面试官会重点关注你对LLM训练算法和强化学习在游戏场景中应用的理解。准备详细解释你在相关项目中的角色和贡献,特别是那些涉及SFT、RLHF/DPO/PPO等算法的案例。面试官可能会询问你如何解决在游戏场景中应用大模型时遇到的具体挑战,例如多轮对话和推理规划的优化。准备好展示你在检索增强和多智能体协作算法上的研究成果,并讨论你在提升强化学习效率和效果上的创新方法。此外,面试官可能会考察你对AI前沿技术的了解程度,以及你在团队协作和沟通方面的能力。在回答问题时,尽量结合具体的项目经验和技术细节,以展示你的专业深度和实践能力。同时,保持对新技术的好奇心和开放态度,表现出你持续学习和适应快速变化的技术环境的能力。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。