京东 – 大模型数据挖掘工程师 职位分析和面试指导

职位描述:

作为大模型研发工程师/架构师,您将深度参与或主导以下一个或多个关键领域的工作:

1. 超大规模数据管理与清洗:数据全生命周期管理,数据质量工程,高质量的预训练、SFT数据、后训练及推理数据的构建、增强与优化;

2. 大模型训练合成数据策略:高效合成数据生成以补充现有数据的不足或领域数据的稀缺;

3. 数据质量及模型评估体系构建与优化:构建数据及模型质量的多维度评估策略,形成科学的指标评估体系,开发高效的评估平台与工具。

职位要求:

1. 硕士及以上学历,计算机、数学、人工智能及STEM等相关专业;

2. 有扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯;

3. 熟悉语言或多模态模型的预训练、后训练及推理模型的数据链路构建、质量优化及效果评估提升,相信AGI和对相关工作抱有热情;

4. 工作认真务实,科学规划,具有极致的探究精神且知行合一,具备较强的责任感;

加分项:

1. 有大模型相关的数据研发、质量及效果评估经验的工作者优先;

2. 熟悉主流大模型数据质量构建策略或业界通用评估框架,曾深度参与大模型数据消融与质量评估等项目;

3. 具有敏锐的数据质量意识,熟悉开源大模型数据质量挖掘或评估框架等相关工具栈使用,有积极提升效率效果的意识。

符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。

招聘部门:

京东

工作地点:

北京

注意:为了确保您掌握真实的招聘信息,上述信息均为原始内容。我们的“面试建议”和“模拟面试”均基于原始招聘信息设计和提供。

面试建议:

京东的大模型数据挖掘工程师职位是一个高度专业化的角色,专注于大模型的数据生命周期管理和质量优化。与其他公司的类似职位相比,京东特别强调对数据质量的极致追求和科学评估体系的构建。面试官会重点关注你在超大规模数据处理、合成数据生成以及数据质量评估方面的实际经验。尤其是你是否具备从数据清洗到模型评估的全链路能力,以及是否能够通过数据优化提升模型效果。

在准备面试时,你需要重点展示你在大模型数据领域的实际项目经验,尤其是那些能够体现你数据质量意识和评估能力的案例。简历中应详细描述你参与过的数据清洗、合成数据生成或评估体系构建的项目,突出你在这些项目中的具体贡献和成果。面试时,准备好回答关于数据质量优化策略、评估指标设计以及工具开发的问题。同时,京东非常看重价值观匹配,确保你在面试中展现出客户为先、创新和拼搏的精神。

在线咨询

提示:由 AI 生成回答,可能存在错误,请注意甄别。