基于噪声感知的语音增强方法、装置、设备及介质

正文

推荐专利

申请号：CN202510826685

申请日期：2025-06-19

公开号：CN120673773A

公开日期：2025-09-19

类型：发明专利

摘要

本发明涉及语音处理技术领域，可应用于金融科技及医疗健康等业务场景中，公开了一种基于噪声感知的语音增强方法、装置、设备及介质，包括：获取目标音频及其环境音频数据与多模态传感器数据，提取环境特征信息并输入音频增强模型生成增强音频信号；获取参考音频样本提取个性化特征向量，对增强音频信号进行个性化处理；采集播放反馈数据，确定播放时域调整参数与播放频域调整参数，调整个性化增强音频信号，生成优化音频信号。本发明通过融合环境感知信息与个性化说话人特征，在播放过程中结合反馈参数实现动态调整，能够在复杂环境下生成清晰、自然且具有个性化风格的优化音频输出，提升语音交互的质量与适应能力。

技术关键词

音频多模态传感器语音特征提取模块调制特征数据设备运动状态信号面部表情特征分布特征参数频谱特征节奏特征噪声频谱噪声特征定位特征样本麦克风阵列采集

系统为您推荐了相关专利信息

一种应用于实验室的大数据存储方法及系统

数据存储方法访问特征存储设备数据迁移节点

一种基于动态负载均衡的区块链多模态事务打包方法

打包方法节点多模态数据处理场景音频

请求处理方法、装置、计算机设备及存储介质

客服接线计算机可读指令关键词情绪识别模型

管道连通性检测方法、系统、机器人及存储介质

连通性检测方法管口主机端音频夹角余弦

音频设备的散热结构

音频设备散热结构散热风机板条弹性压片

基于噪声感知的语音增强方法、装置、设备及介质

站点导航

APP 下载