语音特征处理方法、装置、设备及介质

AITNT
正文
推荐专利
语音特征处理方法、装置、设备及介质
申请号:CN202510692019
申请日期:2025-05-27
公开号:CN120340477A
公开日期:2025-07-18
类型:发明专利
摘要
本发明涉及语音处理技术领域,可应用于金融科技、医疗健康等业务场景中,公开了一种语音特征处理方法、装置、设备及介质,包括:对原始音频信号执行频率分辨率调整生成融合梅尔频带能量,基于融合梅尔频带能量执行时间分辨率分析生成多尺度梅尔谱幅度值,根据噪声强度参数对多尺度梅尔谱幅度值进行非线性变换生成噪声抑制梅尔分量,根据听觉感知模型生成感知加权系数对噪声抑制梅尔分量执行频域能量调整生成梅尔谱图表示。本发明通过在频率分辨率自适应、时间分辨率动态调整和听觉感知建模的基础上,对多尺度梅尔谱幅度值应用非线性变换与感知加权处理,能够有效降低噪声干扰对语音特征的影响,增强语音信号的关键信息保留能力。
技术关键词
语音特征 听觉感知模型 生成多尺度 生成噪声 分辨率 噪声强度 非线性 信号噪声比 卷积神经网络模块 噪声抑制模块 背景噪声 频率 声码器 音频采集模块 低频段
系统为您推荐了相关专利信息
1
一种基于可微采样的点云复原方法
采样模块 复原方法 特征提取模块 重建误差 上采样
2
端到端的语音合成方法、装置、计算机设备及存储介质
语音特征 神经网络模型构建 声码器 文本编码器 音频
3
融合视觉扩散与语音情感识别的虚拟医生诊断辅助系统
诊断辅助系统 融合视觉 图像特征提取 关键点 注意力机制
4
一种多分辨率格网的海底地形建模方法及系统
地形建模方法 多分辨率 格网模型 离散点云数据 网格
5
基于无人机的多模态数据融合的病虫害智能监测系统
智能监测系统 多模态数据管理 无人机 多源异构数据 多层级特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号