摘要
本公开提供了一种远场声纹识别方法、装置、电子设备及存储介质,采集样本近场音频数据,基于所述数据构建包含频带相关混响模型及声源与接收设备定向性模型的几何声学传播模型,生成房间脉冲响应函数;将样本近场语音与所述脉冲响应函数进行卷积,生成模拟远场音频数据;采用说话人表征权重预保留训练策略,基于样本近场音频进行预训练并基于模拟远场音频进行微调,构建远场声纹识别模型;将去混响后的待测远场音频与基准近场音频输入所述模型,计算相似度并输出识别结果。解决了远场语音数据稀缺、模型跨域适应性差、信号混响严重等问题,显著提升了远场声纹识别系统的准确率与鲁棒性。
技术关键词
声纹识别模型
房间脉冲响应
音频
声纹识别方法
接收设备
模拟麦克风
混响时间
滤波器系数
数据
混响分量
样本
吸声
机器可读指令
预测误差
边界积分方程
声波传播路径
声纹识别装置
声纹识别系统
系统为您推荐了相关专利信息
音乐生成方法
GAN模型
音频
MFCC特征
指数
终端设备
混合蛙跳算法
局部搜索算法
指标
模拟退火算法
面部
电子设备
姿态特征
姿态传感器
信息获取方法
制动开关
综合监测方法
振动传感器
多模态
气体压力表