摘要
本申请公开了一种语音识别方法、网络模型、设备及存储介质,通过结合UNet和高效注意力机制,更好地捕获和利用多尺度的细节信息,从而提高语音识别的准确性,其中UNet的跳跃连接有助于保留关键的时频特征,并将其传递到解码阶段,使得识别结果更加精确;高效注意力机制则使网络能够更好地建模长范围上下文的依赖关系,捕捉语音信号中的全局信息,提高对上下文的理解和建模能力。将UNet的U型结构嵌入到Transformer框架下,可以充分利用跳跃连接和特征重用的优势,减少网络的参数量,同时加速网络的训练过程,提高系统的效率和实用性。
技术关键词
语音识别网络
语音识别方法
编码器
解码器
存储程序代码
语音识别设备
注意力机制
可读存储介质
上采样
模块
处理器
框架
多尺度
音频
存储器
计算机
因子
系统为您推荐了相关专利信息
局部放电事件
算法模型
分类方法
监督学习方法
YOLO算法
医学图像分割方法
医学图像数据集
编码模块
解码模块
生成多尺度
图像降噪方法
解码器
编码器特征
多通道
混合损失函数
智能马桶清洗
清洗喷头
卷积神经网络模型
图像编码器
智能马桶座圈