一种基于多模态集成的航空语音转写方法、装置及介质

正文

推荐专利

申请号：CN202511070449

申请日期：2025-07-31

公开号：CN120853573A

公开日期：2025-10-28

类型：发明专利

摘要

本发明公开了一种基于多模态集成的航空语音转写方法、装置及介质，所述方法包括：获取输入方的初始语音信号；将输入方的初始语音信号转换为目标语言文本；基于多模态大模型对目标语言文本生成纠正建议，并输出至输入方；获取输入方根据纠正建议进行表达修正后的最终语音信号，根据最终语音信号生成以目标语言呈现的指令并发送至接收方。本发明提出一种基于多模态集成的航空语音转写方法、装置及介质，通过多模态大模型驱动的闭环纠错机制和双向实时通信框架，可以将输入方修正后的语音以目标语言的形式生成精准指令发送至接收方，能够解决难以降低塔台与飞行员之间的语言沟通门槛，以及提升空地通信的准确性与效率的问题。

技术关键词

语音转写方法文本航空多模态特征双向长短期记忆网络双向通信机制转写装置语音特征接收方信号音频特征序列文字特征数据一维卷积神经网络声码器塔台

系统为您推荐了相关专利信息

一种基于图像处理的鸭蛋自动分级分拣系统及方法

鸭蛋分拣系统图像处理分拣执行机构多光谱成像

一种跨模态多层融合的情感识别方法和系统

情感识别方法语义特征状态空间模型样本数据生成图像

文本生成方法、文本生成装置、电子设备及存储介质

文本生成方法答案节点标识树形结构

一种基于离线大模型的装备智能保障系统

智能保障系统量子退火算法三元组语义向量表面缺陷图像

一种自动识别电池健康特征的电池剩余寿命预测方法

误差模型特征筛选器容量预测模块电池老化状态重构

一种基于多模态集成的航空语音转写方法、装置及介质

站点导航

APP 下载