1、大模型应用探索:负责研究、引入并微调前沿大语言模型及多模态模型,探索其在业务场景中的落地应用。
2、小模型研发优化:设计、训练和优化轻量级深度学习模型,以满足实际业务对速度、精度和资源消耗的严苛要求。
3、核心算法开发:主导特定CV任务的算法设计、实现与持续优化。
4、全流程项目管理:负责从数据收集、清洗、标注到模型训练、评估与迭代的完整AI项目生命周期管理。
5、模型部署集成:将训练好的模型进行封装、压缩和转换,并集成到生产环境,确保技术顺利落地。
6、技术文档编写:撰写高质量的技术文档,清晰记录研发过程,并与团队协作完成项目上线与迭代。
1、硕士及以上学历,计算机、软件工程、信息技术等相关专业。
2、熟悉Python编程语言,熟悉主流开发框架(如PyTorch、TensorFlow等)。
3、扎实的计算机视觉基础,熟悉目标检测、图像分割、OCR等相关领域的技术和模型。
4、具备独立完成小模型(如CNN、Transformer-based小模型)的设计、训练和调优的能力。
5、理解大模型的基本原理,并有使用Hugging Face等平台的大模型进行微调或应用的实际项目经验。
6、具备良好的项目规划和执行能力,能够独立承担模块设计与开发任务。
7、具备良好的沟通能力和团队协作精神,能够与多方高效协作。
8、具备较强的学习能力和问题解决能力,能够快速适应新技术和新环境。