一种用于深度学习说话人验证的分数域特征提取方法、设备及介质

AITNT
正文
推荐专利
一种用于深度学习说话人验证的分数域特征提取方法、设备及介质
申请号:CN202411503349
申请日期:2024-10-25
公开号:CN119252262A
公开日期:2025-01-03
类型:发明专利
摘要
本发明属于声纹识别技术领域,特别涉及一种用于深度学习说话人验证的分数域特征提取方法、设备及介质。包括以下步骤:对语音信号进行预处理;对选定窗函数分别使用提取自分数阶傅里叶变换的不同阶数的调制因子获取分数阶窗函数;对语音信号分别进行短时傅里叶变换,得到功率谱频谱图;对所得功率谱频谱图,分别通过梅尔滤波器组进行滤波并取对数,得到M维滤波器组特征;对Fbank特征,统一分配初始值为1的可学习参数作为权重,并使用softmax激活函数限制权重总和不变;对加权Fbank特征,按阶次从高到低在时间维上串联拼接为一个多窗分数阶Fbank特征,使用该特征输入深度学习模型进行训练;本发明突出不同阶次特征的重要性,能有效的提高深度学习说话人验证系统的准确性。
技术关键词
分数阶傅里叶变换 滤波器 特征提取方法 深度学习模型 语音 说话人验证系统 功率 信号 声纹识别技术 短时傅里叶变换 训练集数据 处理器 索引 因子 控制权 优化器 超参数 可读存储介质 程序
系统为您推荐了相关专利信息
1
基于监控画面人形模型画面占比的增益调整系统及其方法
网络监控摄像机 麦克风拾音 对讲模块 特征提取单元 深度学习算法
2
一种无人机矢量编队协同控制方法及系统
编队协同控制方法 逃逸机制 构建无人机 无人机编队 人工势场法
3
一种基于多维感知的情绪调节系统及其评估方法
情绪调节系统 生物传感器模块 语音识别模块 环境监测模块 ARIMA模型
4
一种基于视觉图像识别的仔猪保温方法及其系统
仔猪保温 视频流 策略 图像配准 深度学习模型
5
一种基于残差网络的目标飞行轨迹预测补偿方法
飞行轨迹预测 容积信息滤波 残差网络 补偿方法 补偿值
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号