一种用于AI降噪的语音增强方法及系统

AITNT
正文
推荐专利
一种用于AI降噪的语音增强方法及系统
申请号:CN202510061773
申请日期:2025-01-15
公开号:CN119943074A
公开日期:2025-05-06
类型:发明专利
摘要
本申请涉及语音信号处理技术领域,公开了一种用于AI降噪的语音增强方法及系统,其方法包括获取室内场景下不同的人声样本、噪声样本和混响样本;对人声样本、噪声样本和混响样本进行划分;随机抽取一待处理人声和一待处理混响,将待处理人声依次经滤波处理和静音操作后,结合待处理混响进行混响操作,得到带混响人声;随机抽取一待处理噪声,将待处理噪声依次经滤波处理、信噪比调节和静音操作,得到目标噪声;基于带混响人声和目标噪声,生成带噪人声。本申请具有模拟生成的带噪人声更逼近拾音设备采集到的音频,减少了监督学习的难度,有利于取得较好的降噪结果,提高语音增强方法精度的效果。
技术关键词
人声 噪声样本 拾音设备 音频 突发噪声 稳态噪声 信噪比 语音信号处理技术 降噪模型 高通滤波器 低通滤波器 消音器 采样模块 计算机设备 场景
系统为您推荐了相关专利信息
1
多模态的目标说话人提取方法、电子设备和存储介质
音视频 特征提取网络 视觉特征 语义特征 视音频
2
活动录制中实时回放精彩时刻的方法、活动录制装置
监视器 精彩时刻视频 回放模块 多模态 计时器
3
虚拟数字人交互方法、装置、计算机设备和存储介质
递归神经网络 人交互方法 计算机设备 场景 生成训练数据
4
基于骨声纹麦克风的无声命令耳机音频系统
音频系统 麦克风单元 噪声抑制模块 命令 耳机
5
用于理解多媒体的自动化媒体内容识别
媒体项 媒体内容识别 非暂时性计算机可读存储器 计算机视觉 对象检测模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号