一种语音识别方法、网络模型、设备及存储介质

AITNT
正文
推荐专利
一种语音识别方法、网络模型、设备及存储介质
申请号:CN202411015280
申请日期:2024-07-26
公开号:CN118762691A
公开日期:2024-10-11
类型:发明专利
摘要
本申请公开了一种语音识别方法、网络模型、设备及存储介质,通过结合UNet和高效注意力机制,更好地捕获和利用多尺度的细节信息,从而提高语音识别的准确性,其中UNet的跳跃连接有助于保留关键的时频特征,并将其传递到解码阶段,使得识别结果更加精确;高效注意力机制则使网络能够更好地建模长范围上下文的依赖关系,捕捉语音信号中的全局信息,提高对上下文的理解和建模能力。将UNet的U型结构嵌入到Transformer框架下,可以充分利用跳跃连接和特征重用的优势,减少网络的参数量,同时加速网络的训练过程,提高系统的效率和实用性。
技术关键词
语音识别网络 语音识别方法 编码器 解码器 存储程序代码 语音识别设备 注意力机制 可读存储介质 上采样 模块 处理器 框架 多尺度 音频 存储器 计算机 因子
系统为您推荐了相关专利信息
1
一种基于多算法模型的局部放电类型分类方法及系统
局部放电事件 算法模型 分类方法 监督学习方法 YOLO算法
2
基于拓扑约束增强的医学图像分割方法及装置
医学图像分割方法 医学图像数据集 编码模块 解码模块 生成多尺度
3
基于多通道3D U-net的光子计数CT图像降噪方法
图像降噪方法 解码器 编码器特征 多通道 混合损失函数
4
用于智能马桶生产的质量检测方法及系统
智能马桶清洗 清洗喷头 卷积神经网络模型 图像编码器 智能马桶座圈
5
一种复合平压伺服模切机
伺服模切机 平压 电磁 安装壳 高精度编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号