摘要
本申请涉及语音处理技术领域,揭示了一种基于环境噪声自适应的语音增强方法、装置及设备,其中方法包括:基于第一时间间隔,获取目标话筒中的麦克风阵列实时采集的音频,作为第一音频;根据所述第一音频提取声音特征,获得第一特征;基于方案库,根据所述麦克风阵列对应的空间分布特征和所述第一特征,确定采中降噪方案;根据所述采中降噪方案,控制所述麦克风阵列采集音频,作为第二音频;根据所述第二音频进行语音增强,得到目标音频。实现了“动态感知→采中降噪→前端抑制→后端增强”的闭环架构,在复杂声学环境中能够更有效地避免采集到噪声频谱与人声高度混叠的信号,有利于提高后端处理提高语音质量的效果。
技术关键词
音频
噪声特征
麦克风阵列采集
初始时间间隔
空间分布特征
人声
采集误差
模式
主麦克风
话筒
数据
场景
设备主体
标记
波束成形算法
语音特征
线性插值方法
系统为您推荐了相关专利信息
语义向量
短视频
视频生成模型
视频自动生成方法
场景
通信方法
密钥交换协议
椭圆曲线算法
加密数据
轮换策略
监控集成系统
时序卷积神经网络
数字孪生体
识别疾病
随机森林