摘要
本申请提供了一种融合语音增强前端的噪声鲁棒性流式语音识别方法及模型,该模型的训练方法包括获取语音识别训练集;利用因果语音增强网络处理语音训练样本,得到包含全局信息的目标滤波器组特征;利用基于滤波器组的特征提取方法处理语音训练样本,得到原始滤波器组特征;利用注意力机制网络对目标滤波器组特征和原始滤波器组特征进行动态加权融合处理,得到包含语音训练样本中补充信息的目标融合特征;利用初始语音识别网络处理目标融合特征,得到训练文本识别信息;根据目标滤波器组特征、训练文本识别信息和识别文本标签,生成目标损失结果;根据目标损失结果迭代地调整初始语音识别模型的网络参数,得到语音增强识别模型。
技术关键词
融合特征
注意力解码
语音识别网络
滤波器
文本识别
感知特征
流式语音识别方法
语音识别训练
编码特征
语音识别模型
加权特征
频谱特征
识别语音信息
时序
噪声鲁棒性
长短期记忆网络
系统为您推荐了相关专利信息
ZYNQ架构
信号处理平台
动态可重构
AD采样单元
处理单元
断路器设备
诊断方法
断路器机械故障
融合特征
方程
融合深度神经网络模型
时序特征
规模
多模态
跨模态
矿用自卸车
能量分配策略
需求预测模型
设备状态数据
能量管理模块
GAN网络模型
深度强化学习
空间结构特征
识别方法
GAN模型