【岗位职责】
1.推动 ASR/TTS等语音算法在实际业务中的落地与性能优化;
2.负责语音信号前处理相关算法的研发与优化(包括噪声抑制、回声消除、语音增强、声源分离等),提升ASR前端语音质量与鲁棒性;
3.设计低延迟、高性能的流式语音处理方案,支持端侧/云端混合部署,优化系统资源占用;
4.开发并维护音频处理工具链(编解码、格式转换、流媒体处理等)与SDK,支持跨平台调用和部署;
5.跟踪语音信号处理/语音合成/识别/多模态等领域的前沿研究,结合实际场景探索创新解决方案。
【任职要求】
1.计算机、电子工程、信号处理、人工智能等相关专业本科及以上学历;
2.熟悉语音前处理技术,如回声消除、降噪、语音增强、VAD 等;
3.熟悉传统与深度学习语音算法(CTC、Transformer、Whisper等),具备ASR开发经验;
4.熟悉Kaldi等传统语音工具包;
5.熟练掌握Python/C++,熟悉PyTorch 或 TensorFlow,具备流式语音处理和端侧部署经验;
6.熟悉常见音频编解码格式(AAC/Opus/MP3)、流媒体传输协议,有实际音频处理/封装开发经验;
7.具备良好的团队协作、沟通能力,能独立分析并解决复杂工程问题。
【加分项】
●扎实的数字信号处理基础,熟悉FFT、滤波器设计、声学建模等;
●有嵌入式音频开发经验,了解ARM/DSP等硬件平台;
●熟悉实时音频处理框架(如 WebRTC、JACK);
●熟悉小语种ASR/TTS模型优化,有多语种部署经验;
●具备音频硬件接口调试、声学测试经验;