职位描述
岗位职责:
1. 大语言模型研发与优化:基于开源或自研大模型(如GPT、Llama、Mistral等),进行训练、微调、优化和部署,以提升模型性能和适配行业应用场景。
2. 行业知识嵌入:结合行业数据,构建高效的RAG(Retrieval-Augmented Generation)方案,实现精准的知识检索与回答。
3. 推理加速与部署:优化模型推理效率,采用量化、蒸馏、MoE(混合专家)等技术,提升计算资源利用率,并支持在云端或边缘设备上部署。
4. 模型安全与合规:研究和落地LLM在行业应用中的安全防护措施,包括对抗攻击防御、敏感信息过滤、道德约束等,确保符合监管要求。
5. 工具链与基础设施建设:开发和优化高效的MLOps流程,包括数据管道、模型训练、评估、部署和监控。
6. 跨团队协作:与产品、算法、工程、数据团队紧密合作,推动大模型在具体业务场景中的落地。
任职要求:
1. 学历与经验:计算机、人工智能、数学相关专业本科及以上学历,或具备同等工程经验;有LLM相关工作经验者优先。
2. 编程能力:精通Python;熟练使用PyTorch等深度学习框架。
3. 模型研发经验:掌握Transformer架构,具备LLM的训练、微调、推理优化经验,了解RLHF(人类反馈强化学习)者优先。
4. 安全与合规意识:了解AI伦理、模型偏见、数据隐私保护相关知识,并能在模型开发中实践。
5. 行业经验加分项:有金融、医疗、法律、制造业等特定行业的大模型应用经验者优先。
6. 沟通与协作:具备良好的团队合作精神,能高效推动跨团队合作。
加分项:
* 在国际会议发表过相关论文。
* 参与或主导过开源大模型项目,如Hugging Face、Meta AI等社区贡献。
* 有RAG、自动化Agent、AIGC产品开发经验。
* 具备LLM推理加速、模型压缩、硬件加速(CUDA、TPU)等优化经验。