融合语音增强前端的噪声鲁棒性流式语音识别方法及模型

AITNT
正文
推荐专利
融合语音增强前端的噪声鲁棒性流式语音识别方法及模型
申请号:CN202510130554
申请日期:2025-02-06
公开号:CN119601017B
公开日期:2025-04-08
类型:发明专利
摘要
本申请提供了一种融合语音增强前端的噪声鲁棒性流式语音识别方法及模型,该模型的训练方法包括获取语音识别训练集;利用因果语音增强网络处理语音训练样本,得到包含全局信息的目标滤波器组特征;利用基于滤波器组的特征提取方法处理语音训练样本,得到原始滤波器组特征;利用注意力机制网络对目标滤波器组特征和原始滤波器组特征进行动态加权融合处理,得到包含语音训练样本中补充信息的目标融合特征;利用初始语音识别网络处理目标融合特征,得到训练文本识别信息;根据目标滤波器组特征、训练文本识别信息和识别文本标签,生成目标损失结果;根据目标损失结果迭代地调整初始语音识别模型的网络参数,得到语音增强识别模型。
技术关键词
融合特征 注意力解码 语音识别网络 滤波器 文本识别 感知特征 流式语音识别方法 语音识别训练 编码特征 语音识别模型 加权特征 频谱特征 识别语音信息 时序 噪声鲁棒性 长短期记忆网络
系统为您推荐了相关专利信息
1
一种基于ZYNQ架构的动态可重构信号处理平台
ZYNQ架构 信号处理平台 动态可重构 AD采样单元 处理单元
2
一种断路器设备的可靠性诊断方法、介质及系统
断路器设备 诊断方法 断路器机械故障 融合特征 方程
3
基于多模态融合的出行选址方法和系统
融合深度神经网络模型 时序特征 规模 多模态 跨模态
4
基于深度学习的增程式矿用自卸车能量优化系统及方法
矿用自卸车 能量分配策略 需求预测模型 设备状态数据 能量管理模块
5
一种基于Inception-GAN的HRRP雷达目标识别方法
GAN网络模型 深度强化学习 空间结构特征 识别方法 GAN模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号