【岗位职责】
1.负责AI模型推理服务的后端架构设计、接口开发与部署落地;
2.设计并优化数据库结构,处理高并发场景下的数据存储与查询;
3.定位并解决推理服务中存在的性能瓶颈,优化系统响应时间与资源调度效率。
4.构建并优化CI/CD自动化运维体系,提升模型上线效率和系统迭代速度;
5.搭建并维护基于Docker/Kubernetes的生产环境,保障推理服务的稳定性、高可用性和弹性扩展能力;
【任职要求】
1.熟悉Python/Go/Java中至少一门语言;
2.熟悉微服务架构,熟练掌握RESTful/gRPC接口开发;
3.熟练使用MySQL/PostgreSQL等关系型数据库,了解Redis/MongoDB等NoSQL;
4.深入理解容器化技术,具备K8s生产环境部署运维经验;
5.良好的系统设计能力,能独立完成技术方案设计和文档编写。
【加分项】
1.熟悉大语言模型(LLM)或 Diffusion 等深度学习模型的部署、优化与服务化流程;
2.有用户权限系统、任务调度、资源管理等后端业务模块的开发经验;
3.有在云平台(如阿里云、腾讯云等)上构建高并发服务的实战经验。