摘要
本发明公开的一种基于复杂场景的自适应声纹识别方法,属于语音领域的自适应声纹识别领域。本发明实现方法为:构建域自适应声纹模型,基于CN‑Celeb数据采用增量学习策略训练自适应声纹模型,通过模型蒸馏实现对已有源域知识的保留和对目标域知识的快速吸收,避免在域迁移过程中的灾难性遗忘;自适应声纹模型通过联合源域和目标域的半监督训练方法,优化自适应声纹模型在两个域上的表现,使自适应声纹模型能够适应新的数据分布,在复杂场景中基于训练好的域自适应声纹模型实现自适应声纹识别,有效克服灾难性遗忘现象。本发明能够提升对复杂场景中自适应声纹识别的准确率和鲁棒性。本发明尤其是能够提升在戏剧、歌声等多变环境下识别的准确率和鲁棒性。
技术关键词
声纹识别方法
无监督学习
场景
声纹模型训练
嵌入特征
智能语音助手
隐私保护功能
分类模型构建
学生
教师
样本
多层感知机
标识符
鲁棒性
声学特征
异常事件
数据分布
系统为您推荐了相关专利信息
智能制冷控制
高效储能电池
电池寿命预测
液冷机组
储能场景
电力监控系统
网络安全态势感知系统
威胁监测系统
图样
网络安全事件