一种多信道语音处理方法及系统

AITNT
正文
推荐专利
一种多信道语音处理方法及系统
申请号:CN202510909250
申请日期:2025-07-01
公开号:CN120600031A
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种多信道语音处理方法及系统,属于人工智能与语音信号处理领域。包括:获取多信道音频信号并构建SSL的单信道预训练模型;基于多信道音频信号,对SSL的单信道预训练模型进行结构优化,得到多信道声纹特征提取预训练模型;进行多阶段联合优化训练,结合AAM损失对多信道声纹特征提取预训练模型进行微调,生成多信道语音处理模型;当接收到待处理的多声道音频信号时,通过多信道语音处理模型处理待处理的多声道音频信号,输出高区分性的多信道声纹特征。本发明旨在提高多信道场景下说话人验证的准确性和鲁棒性,显著降低错误率并提升系统对复杂声学环境的适应能力。
技术关键词
多信道 预训练模型 多声道 音频 声纹特征 多阶段 联合注意力机制 信道特征 语音信号处理 前馈神经网络 模型训练模块 摘要 通道 鲁棒性 数据获取模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号