求职招聘详情

大模型推理工程师 15K-25K/月

工作地点：广东/深圳 | 工作年限：不限 | 学历：硕士

环境好

双休

五险一金

交通方便

管理规范

全勤奖

申请职位

职聊

温

HR主管 · 深圳陆兮科技有限公司

聊一聊

职位描述

【岗位职责】
1. 负责深度学习/机器学习模型在端侧设备（如安卓、iOS）的部署与优化。
2. 设计并实现模型从 ONNX 格式到端侧设备推理框架的转换与适配，如 TVM、ncnn、MNN、CoreML 等。
3. 针对移动端的硬件资源，优化模型推理速度、内存占用和功耗，提升设备运行效率与响应速度。
4. 与算法团队协作，进行模型量化、剪枝等优化，确保端侧设备的推理效果与性能。
5. 解决端侧部署中的性能瓶颈、兼容性问题，保证系统的稳定性与可靠性。

【任职要求】
1. 熟悉C++，能够在移动端环境下进行开发与调试。
2. 熟悉将 ONNX 格式的深度学习/机器学习模型转换为适用于端侧设备的格式，了解 ONNX 转换到 TVM、ncnn、MNN等推理引擎的过程与技术。
3. 熟悉端侧推理框架，如 TVM、ncnn、MNN、CoreML，具有模型部署经验。
4. 理解并能实际应用模型量化（如 INT8、混合精度）技术，优化端侧推理性能。
5. 具备较强的分析与问题解决能力，能够有效进行性能调优与优化。

【加分项】
1. 有 LLM 模型在端侧（如 llama.cpp, MLC）部署经验者优先。
2. 熟悉 iOS 和安卓平台的硬件架构，并能根据不同平台的特点进行模型优化，如苹果 CoreML、安卓 NNAPI、Vulkan/OpenCL 等。

公司信息

陆兮科技是中国第一家完全本土自研的通用大模型架构公司。我们的科研团队由海外归国教授、博导和博士科学家组成，创始人、首席技术官周芃博士是全球类脑算法领域领先科学家，曾荣获国际电气电子工程师协会电路与系统工程领域最高学术奖项“达灵顿奖”。陆兮科技致力于打破Transformer架构在上下文长度、算力消耗、能耗等方面的技术局限，独家提出全球最领先的『类脑架构』，开发出包括NLM大模型、行业基础设施大模型、端侧离线大模型在内的一系列普惠商用与民用产品。其中NLM大模型产品线广泛应用于政务服务、医疗、教育、法律、娱乐与智能终端等不同行业与设备场景。在G端和B端，陆兮科技已携手多家国央企客户，在医疗数智化诊断、水文与地理信息数智化处理、政府信息处理数智化转型、教育科技数智普惠等领域共同发力，打造了一系列低成本、低能耗、高效率、精准服务高质量发展的行业大模型底座。在C端，陆兮科技携手多家国内顶尖手持与穿戴智能设备商，成功打造可于百元机、低端微处理器架构和所有主流手机操作系统顺畅运行的离线端侧大模型，实现100%本地计算、100%本地存储、100%完全离线运行、0数据消耗、运存占用小于1G、3GB运存跑得动、无需全文检索即可判断使用意图等里程碑突破、为『人工智能+』时代实现大模型人人可用、普惠人人的目标添砖加瓦。陆兮科技致力于将大模型放进小设备，让人人都能用上安全、隐私的本地大语言模型。如果你渴望探索人工智能的无限可能，并为此投身全新的技术创新，陆兮团队热切期待你的加入！

查看全部

职位分析

您与该职位的匹配度：

一般

良好

优秀

AI推荐

市场运营岗 [广东/深圳] 2K-3K/月

经验不限

本科