摘要
本发明属于声纹识别技术领域,特别涉及一种用于深度学习说话人验证的分数域特征提取方法、设备及介质。包括以下步骤:对语音信号进行预处理;对选定窗函数分别使用提取自分数阶傅里叶变换的不同阶数的调制因子获取分数阶窗函数;对语音信号分别进行短时傅里叶变换,得到功率谱频谱图;对所得功率谱频谱图,分别通过梅尔滤波器组进行滤波并取对数,得到M维滤波器组特征;对Fbank特征,统一分配初始值为1的可学习参数作为权重,并使用softmax激活函数限制权重总和不变;对加权Fbank特征,按阶次从高到低在时间维上串联拼接为一个多窗分数阶Fbank特征,使用该特征输入深度学习模型进行训练;本发明突出不同阶次特征的重要性,能有效的提高深度学习说话人验证系统的准确性。
技术关键词
分数阶傅里叶变换
滤波器
特征提取方法
深度学习模型
语音
说话人验证系统
功率
信号
声纹识别技术
短时傅里叶变换
训练集数据
处理器
索引
因子
控制权
优化器
超参数
可读存储介质
程序
系统为您推荐了相关专利信息
网络监控摄像机
麦克风拾音
对讲模块
特征提取单元
深度学习算法
编队协同控制方法
逃逸机制
构建无人机
无人机编队
人工势场法
情绪调节系统
生物传感器模块
语音识别模块
环境监测模块
ARIMA模型
飞行轨迹预测
容积信息滤波
残差网络
补偿方法
补偿值