职位描述
职责:
战略执行:能够跟踪和引入最新的AI技术。制定和执行算法团队的技术战略,确保技术方向与公司业务目标一致。
算法研究与开发:负责大语言模型、机器学习、深度学习、自然语言处理、计算机视觉等领域的前沿算法研究,设计并实现高效的算法模型,解决业务中的复杂问题
项目实施与交付:作为项目核心成员或项目负责人,与产品经理合作,将业务需求转化为技术解决方案。带领团队进行算法项目的实施,包括需求分析、算法设计、模型训练、系统集成等环节,确保项目按时高质量交付;对现有算法进行持续优化,提升算法的性能、准确性和稳定性。
数据分析建模:深入分析业务数据,挖掘数据中的潜在价值和规律,构建数据驱动的模型,为业务决策提供有力支持;负责数据预处理、特征工程等工作,确保数据质量和模型训练效果。
技术研究与创新:跟踪业界最新算法和技术动态,探索新技术在公司业务中的应用可能性,推动技术创新和突破;参与撰写技术专利和论文,提升公司在算法领域的技术影响力
团队管理与写作:为团队成员提供技术指导和培训,帮助他们提升专业技能;与其他部门如产品、运营、工程等紧密合作,理解业务需求,将算法技术有效应用于实际业务场景。
任职要求:
数学、物理学、人工智能、计算机科学或相关领域的硕士及以上学历。
5年以上AI研发经验,至少2年团队管理经验。
热爱技术,肯于钻研,深信技术可以改变世界。
掌握数据结构、算法原理、计算机网络、操作系统等计算机基础知识。
具备良好的数学基础,熟悉统计学、概率论、线性代数等数学工具。
精通大语言模型、AI智能体构建,对搜索算法和OCR技术有所了解。
熟悉深度学习框架(如TensorFlow、PyTorch、PaddlePaddle、MindSpore等)。
熟悉MLP、CNN、RNN、LSTM、Transformer、BERT、GPT等典型深度学习模型的原理和局限性。
熟悉基于大模型进行Prompt、RAG、Agent开发,有构件智能体或使用如AutoGPT、BabyAGI等开源AI智能体框架进行项目开发的经验。
熟悉至少一种跨深度学习框架通用分布式训练框架,如DeepSpeed、Megatron-LM、Colossal-AI、BMTrain、AscendSpeed等。
熟悉至少一种深度学习框架内嵌式分布式训练框架,如PyTorch、TensorFlow、MindSpore、PaddlePaddle等。
了解模型训练中的断点处理,如断点保持、断点续训、断点重训等。
熟悉分布式训练方法,如数据并行、模型并行(流水线并行,张量并行)、混合并行、MOE并行等。
熟悉训练优化技术,如ZeRO、混合精度训练等。
熟悉模型微调方法,如全参微调、低参微调(Lora)、指令微调等。
了解国产GPU芯片优先。
良好的沟通能力和团队管理能力。
工作地点:北京、雄安