一种远场声纹识别方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
一种远场声纹识别方法、装置、电子设备及存储介质
申请号:CN202511076211
申请日期:2025-08-01
公开号:CN120808790A
公开日期:2025-10-17
类型:发明专利
摘要
本公开提供了一种远场声纹识别方法、装置、电子设备及存储介质,采集样本近场音频数据,基于所述数据构建包含频带相关混响模型及声源与接收设备定向性模型的几何声学传播模型,生成房间脉冲响应函数;将样本近场语音与所述脉冲响应函数进行卷积,生成模拟远场音频数据;采用说话人表征权重预保留训练策略,基于样本近场音频进行预训练并基于模拟远场音频进行微调,构建远场声纹识别模型;将去混响后的待测远场音频与基准近场音频输入所述模型,计算相似度并输出识别结果。解决了远场语音数据稀缺、模型跨域适应性差、信号混响严重等问题,显著提升了远场声纹识别系统的准确率与鲁棒性。
技术关键词
声纹识别模型 房间脉冲响应 音频 声纹识别方法 接收设备 模拟麦克风 混响时间 滤波器系数 数据 混响分量 样本 吸声 机器可读指令 预测误差 边界积分方程 声波传播路径 声纹识别装置 声纹识别系统
系统为您推荐了相关专利信息
1
一种基于AdobeAudition(AU)扩展程序的自动对轨系统及方法
音频匹配 标记 校验模块 程序 数据标签
2
一种基于BPM节奏匹配的AI音乐生成方法及系统
音乐生成方法 GAN模型 音频 MFCC特征 指数
3
一种终端设备及媒资的生成方法
终端设备 混合蛙跳算法 局部搜索算法 指标 模拟退火算法
4
面部信息获取方法和电子设备
面部 电子设备 姿态特征 姿态传感器 信息获取方法
5
一种基于声纹识别的20KV电气制动开关多模态工况异常综合监测系统及方法
制动开关 综合监测方法 振动传感器 多模态 气体压力表
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号