一种用于深度学习说话人验证的分数域特征提取方法、设备及介质

正文

推荐专利

申请号：CN202411503349

申请日期：2024-10-25

公开号：CN119252262A

公开日期：2025-01-03

类型：发明专利

摘要

本发明属于声纹识别技术领域，特别涉及一种用于深度学习说话人验证的分数域特征提取方法、设备及介质。包括以下步骤：对语音信号进行预处理；对选定窗函数分别使用提取自分数阶傅里叶变换的不同阶数的调制因子获取分数阶窗函数；对语音信号分别进行短时傅里叶变换，得到功率谱频谱图；对所得功率谱频谱图，分别通过梅尔滤波器组进行滤波并取对数，得到M维滤波器组特征；对Fbank特征，统一分配初始值为1的可学习参数作为权重，并使用softmax激活函数限制权重总和不变；对加权Fbank特征，按阶次从高到低在时间维上串联拼接为一个多窗分数阶Fbank特征，使用该特征输入深度学习模型进行训练；本发明突出不同阶次特征的重要性，能有效的提高深度学习说话人验证系统的准确性。

技术关键词

分数阶傅里叶变换滤波器特征提取方法深度学习模型语音说话人验证系统功率信号声纹识别技术短时傅里叶变换训练集数据处理器索引因子控制权优化器超参数可读存储介质程序

系统为您推荐了相关专利信息

基于监控画面人形模型画面占比的增益调整系统及其方法

网络监控摄像机麦克风拾音对讲模块特征提取单元深度学习算法

一种无人机矢量编队协同控制方法及系统

编队协同控制方法逃逸机制构建无人机无人机编队人工势场法

一种基于多维感知的情绪调节系统及其评估方法

情绪调节系统生物传感器模块语音识别模块环境监测模块 ARIMA模型

一种基于视觉图像识别的仔猪保温方法及其系统

仔猪保温视频流策略图像配准深度学习模型

一种基于残差网络的目标飞行轨迹预测补偿方法

飞行轨迹预测容积信息滤波残差网络补偿方法补偿值

一种用于深度学习说话人验证的分数域特征提取方法、设备及介质

站点导航

APP 下载