摘要
本发明提供了一种快速舱音识别方法、介质及设备,涉及语音识别技术领域,所述方法将目标舱音输入到目标语音识别模型以获取目标舱音对应的预测文本,其中,目标语音识别模型中的音频特征融合模块通过将Fbank特征中每a帧连续的特征向量拼接成一个特征向量,减少了后续处理的数据量,降低了计算复杂度,加快了处理速度,目标语音识别模型中的解码模块中的非自回归解码器允许并行化生成输出文本,一次性生成整个输出序列,而非逐词生成,减少了基于上下文的推测,确保输出的文本更接近实际内容,同时大幅提升了解码速度,不仅显著地提高了舱音识别的速度还确保了预测文本能够精确反映舱音中的实际内容。
技术关键词
语音识别模型
识别方法
音频特征
解码模块
非瞬时性计算机可读存储介质
编码模块
文本
识别模块
编码器
样本
语音识别技术
解码器
人声
处理器
矩阵
航空器
字符
存储器
系统为您推荐了相关专利信息
dropout算法
物体识别方法
物体识别模型
触觉特征
特征提取网络
人机交互方法
监测数据处理
情感倾向识别
语音声学特征
性能监测数据
水下机器人视觉
解码器
解压缩方法
解码模块
图像解码端