一种快速舱音识别方法、介质及设备

AITNT
正文
推荐专利
一种快速舱音识别方法、介质及设备
申请号:CN202510672144
申请日期:2025-05-23
公开号:CN120412589A
公开日期:2025-08-01
类型:发明专利
摘要
本发明提供了一种快速舱音识别方法、介质及设备,涉及语音识别技术领域,所述方法将目标舱音输入到目标语音识别模型以获取目标舱音对应的预测文本,其中,目标语音识别模型中的音频特征融合模块通过将Fbank特征中每a帧连续的特征向量拼接成一个特征向量,减少了后续处理的数据量,降低了计算复杂度,加快了处理速度,目标语音识别模型中的解码模块中的非自回归解码器允许并行化生成输出文本,一次性生成整个输出序列,而非逐词生成,减少了基于上下文的推测,确保输出的文本更接近实际内容,同时大幅提升了解码速度,不仅显著地提高了舱音识别的速度还确保了预测文本能够精确反映舱音中的实际内容。
技术关键词
语音识别模型 识别方法 音频特征 解码模块 非瞬时性计算机可读存储介质 编码模块 文本 识别模块 编码器 样本 语音识别技术 解码器 人声 处理器 矩阵 航空器 字符 存储器
系统为您推荐了相关专利信息
1
面向应急场景的态势表征与推演方法
推演方法 序列 矩阵 编码模块 场景
2
基于哈希算法的晶圆生产工况异常识别方法、装置及设备
异常识别方法 晶圆 数值 哈希算法 数据
3
一种基于触觉引导的扩散自适应融合的物体识别方法
dropout算法 物体识别方法 物体识别模型 触觉特征 特征提取网络
4
一种多模态智能数字人的人机交互方法和系统
人机交互方法 监测数据处理 情感倾向识别 语音声学特征 性能监测数据
5
一种水下机器人视觉图像压缩、解压缩及传输方法及装置
水下机器人视觉 解码器 解压缩方法 解码模块 图像解码端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号