职位描述
职位描述
1.负责模型训练和效果优化,并训练模型方法和框架持续迭代优化,包括但不限于seq2seq、gan、diffusion models、多模态生成等研发工作;
2.负责研发下游任务,prompt设计,fine-tuning,模型蒸馏, 可控⽂本⽣成,⻛格和主题控制等;
3.模型支持字节内部智能标注应用场景适配;
4.参与模型的产品落地,包括基于反馈的算法调优、算法创新、系统评测等。
职位要求
1、硕士及以上学历(优先),具备机器学习/深度学习/计算机视觉/nlp/相关专业知识;
2、优秀的编程能力,精通python/c++,熟悉pytorch分布式训练;
3、熟悉前沿的神经网络架构(transformer,vit,clip)并有实际动手经验,非常熟悉pytorch, huggingface, cuda等技术栈
4、具备深厚的nlp基础和前沿跟踪能力,具备模型预训练,文本生成,多伦对话实战经验优先;
5、在内容生成方向有较为深入的研究和探索,富于热情,自驱力强,勇于进行创新实践和技术突破
6、关注nlg及多模态生成领域的业界最新动态,如midiourney等。