摘要
本申请提供的应用于噪音环境下的语音识别方法和装置、设备及介质,涉及计算机技术领域。在本申请中,首先,获取目标环境下的目标语音数据,并获取预先针对目标环境配置的标准噪音数据;其次,从目标语音数据中提取出与标准噪音数据之间在潜在语义信息层面具有相关性的待分离语音数据;然后,基于待分离语音数据对目标语音数据进行去噪分离处理,形成去噪语音数据;进一步,在目标语音数据的语义编解码过程中,融合去噪语音数据,得到目标语音解码特征;最后,基于目标语义解码特征进行语音识别,输出目标语音识别结果。基于上述内容,可以改善现有技术中存在的对于噪音环境下的语音识别结果的准确度相对不高的问题。
技术关键词
语音特征
语音编码
语音识别方法
压缩特征
注意力
识别语音数据
语义
语音编解码模块
多层次
语音识别装置
融合去噪
语音去噪
语音识别模块
参数
可读存储介质
存储计算机程序
系统为您推荐了相关专利信息
启发式算法
智能网络
排产模型
数据抽样
多头注意力机制
孩子
动作控制模块
电子宠物
语音交互模块
控制器模块
多模态医学影像
语义分割模型
评分方法
图谱
分区
无人机
轨迹预测装置
生成对抗网络
编码器
解码器结构
图像增强方法
神经网络模型
亮度
软件程序产品
逆变模块