一种远场声纹识别方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202511076211

申请日期：2025-08-01

公开号：CN120808790A

公开日期：2025-10-17

类型：发明专利

摘要

本公开提供了一种远场声纹识别方法、装置、电子设备及存储介质，采集样本近场音频数据，基于所述数据构建包含频带相关混响模型及声源与接收设备定向性模型的几何声学传播模型，生成房间脉冲响应函数；将样本近场语音与所述脉冲响应函数进行卷积，生成模拟远场音频数据；采用说话人表征权重预保留训练策略，基于样本近场音频进行预训练并基于模拟远场音频进行微调，构建远场声纹识别模型；将去混响后的待测远场音频与基准近场音频输入所述模型，计算相似度并输出识别结果。解决了远场语音数据稀缺、模型跨域适应性差、信号混响严重等问题，显著提升了远场声纹识别系统的准确率与鲁棒性。

技术关键词

声纹识别模型房间脉冲响应音频声纹识别方法接收设备模拟麦克风混响时间滤波器系数数据混响分量样本吸声机器可读指令预测误差边界积分方程声波传播路径声纹识别装置声纹识别系统

系统为您推荐了相关专利信息

一种基于AdobeAudition（AU）扩展程序的自动对轨系统及方法

音频匹配标记校验模块程序数据标签

一种基于BPM节奏匹配的AI音乐生成方法及系统

音乐生成方法 GAN模型音频 MFCC特征指数

一种终端设备及媒资的生成方法

终端设备混合蛙跳算法局部搜索算法指标模拟退火算法

面部信息获取方法和电子设备

面部电子设备姿态特征姿态传感器信息获取方法

一种基于声纹识别的20KV电气制动开关多模态工况异常综合监测系统及方法

制动开关综合监测方法振动传感器多模态气体压力表

一种远场声纹识别方法、装置、电子设备及存储介质

站点导航

APP 下载