一种快速舱音识别方法、介质及设备

正文

推荐专利

一种快速舱音识别方法、介质及设备

申请号：CN202510672144

申请日期：2025-05-23

公开号：CN120412589A

公开日期：2025-08-01

类型：发明专利

摘要

本发明提供了一种快速舱音识别方法、介质及设备，涉及语音识别技术领域，所述方法将目标舱音输入到目标语音识别模型以获取目标舱音对应的预测文本，其中，目标语音识别模型中的音频特征融合模块通过将Fbank特征中每a帧连续的特征向量拼接成一个特征向量，减少了后续处理的数据量，降低了计算复杂度，加快了处理速度，目标语音识别模型中的解码模块中的非自回归解码器允许并行化生成输出文本，一次性生成整个输出序列，而非逐词生成，减少了基于上下文的推测，确保输出的文本更接近实际内容，同时大幅提升了解码速度，不仅显著地提高了舱音识别的速度还确保了预测文本能够精确反映舱音中的实际内容。

技术关键词

语音识别模型识别方法音频特征解码模块非瞬时性计算机可读存储介质编码模块文本识别模块编码器样本语音识别技术解码器人声处理器矩阵航空器字符存储器

系统为您推荐了相关专利信息

面向应急场景的态势表征与推演方法

推演方法序列矩阵编码模块场景

基于哈希算法的晶圆生产工况异常识别方法、装置及设备

异常识别方法晶圆数值哈希算法数据

一种基于触觉引导的扩散自适应融合的物体识别方法

dropout算法物体识别方法物体识别模型触觉特征特征提取网络

一种多模态智能数字人的人机交互方法和系统

人机交互方法监测数据处理情感倾向识别语音声学特征性能监测数据

一种水下机器人视觉图像压缩、解压缩及传输方法及装置

水下机器人视觉解码器解压缩方法解码模块图像解码端

一种快速舱音识别方法、介质及设备

站点导航

APP 下载