基于噪声感知的语音增强方法、装置、设备及介质

AITNT
正文
推荐专利
基于噪声感知的语音增强方法、装置、设备及介质
申请号:CN202510826685
申请日期:2025-06-19
公开号:CN120673773A
公开日期:2025-09-19
类型:发明专利
摘要
本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于噪声感知的语音增强方法、装置、设备及介质,包括:获取目标音频及其环境音频数据与多模态传感器数据,提取环境特征信息并输入音频增强模型生成增强音频信号;获取参考音频样本提取个性化特征向量,对增强音频信号进行个性化处理;采集播放反馈数据,确定播放时域调整参数与播放频域调整参数,调整个性化增强音频信号,生成优化音频信号。本发明通过融合环境感知信息与个性化说话人特征,在播放过程中结合反馈参数实现动态调整,能够在复杂环境下生成清晰、自然且具有个性化风格的优化音频输出,提升语音交互的质量与适应能力。
技术关键词
音频 多模态传感器 语音 特征提取模块 调制特征 数据 设备运动状态 信号 面部表情特征 分布特征 参数 频谱特征 节奏特征 噪声频谱 噪声特征 定位特征 样本 麦克风阵列采集
系统为您推荐了相关专利信息
1
一种应用于实验室的大数据存储方法及系统
数据存储方法 访问特征 存储设备 数据迁移 节点
2
一种基于动态负载均衡的区块链多模态事务打包方法
打包方法 节点 多模态 数据处理场景 音频
3
请求处理方法、装置、计算机设备及存储介质
客服 接线 计算机可读指令 关键词 情绪识别模型
4
管道连通性检测方法、系统、机器人及存储介质
连通性检测方法 管口 主机端 音频 夹角余弦
5
音频设备的散热结构
音频设备 散热结构 散热风机 板条 弹性压片
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号