摘要
本申请公开了一种语音信号处理方法、装置、电子设备及非易失性存储介质。其中,该方法包括:获取原始语音信号,并对原始语音信号进行特征提取,得到原始语音信号对应的声学特征;采用语音信号处理模型,对声学特征进行分析,得到原始语音信号对应的第一参数和第二参数,其中,第一参数用于表征原始语音信号中语音流的语音质量,第二参数用于表征原始语音信号中语音流对应的声源距离的远近程度;依据第一参数和第二参数,确定原始语音信号中的干扰语音流,并将干扰语音流从原始语音信号中筛除,得到目标语音信号。本申请解决了在复杂声学场景下,人机语音交互往往受到背景声的干扰,造成的用户体验不佳的技术问题。
技术关键词
语音信号处理方法
声学特征
预训练模型
距离估计
非易失性存储介质
参数
样本
局部空间特征
标签
语音信号处理装置
时序特征
误差
线性
双向长短期记忆网络
注意力
人机语音交互
能量分布特征
系统为您推荐了相关专利信息
数据融合方法
特征提取模型
多头注意力机制
模态传感器
融合策略
预训练模型
人工智能模型
残差神经网络
图像
注意力机制
关键词
集中度
非易失性存储介质
指标
计算机可读指令
泄漏源定位方法
接收机
指纹数据库
分子
构建系统模型