自适应对齐的跨模态视觉-语言船舶智能人机交互方法

正文

推荐专利

申请号：CN202411454322

申请日期：2024-10-17

公开号：CN119357897A

公开日期：2025-01-24

类型：发明专利

摘要

本发明实施例公开了一种自适应对齐的跨模态视觉‑语言船舶智能人机交互方法，包括从船载视觉传感器采集的视觉图像中提取目标图像objects语义表示以及每个objects对应的位置信息；从视觉图像的对应语言指令中提取文本tokens语义表示、并计算文本总结表示；对提取的文本tokens语义表示进行模内对齐操作；对提取的图像tokens语义表示进行模内与模间交互对齐；对细粒度的文本tokens语义表示信息进行压缩整合，融合文本语义表示与跨模态后的图像objects语义表示；将融合特征进行投影，构建损失函数，获取与语言指令相关的目标及其位置，本发明便于船员在巡航过程中能够与智能识别场景进行实时人机互动，提升船舶的智能化与操作效率，以便更好地进行下一步智能决策。

技术关键词

智能人机交互方法语义特征文本定位特征矩阵注意力方法融合特征船舶坐标视觉传感器图像编码预训练语言模型编码模块指令细粒度特征

系统为您推荐了相关专利信息

电流互感器的故障诊断方法、装置、设备及存储介质

互补集合经验模态分解故障诊断方法互感器电流注意力机制

用于机器人曲面铣削轮廓误差监测的特征融合与精炼嵌入稀疏贝叶斯学习方法及系统

稀疏贝叶斯学习回归预测模型字典切削力信息数据处理终端

一种基于差谱提取的再生剂老化失效行为识别方法及系统

老化沥青识别方法指数剪切模量算法模型

一种面向问答大模型的多智能体系统初始化方法及装置

初始化方法团队文本编码器排序算法计算机可读取存储介质

问答模型训练方法、问答处理方法及相关设备

问答模型训练方法数据实体语义特征可读存储介质

自适应对齐的跨模态视觉-语言船舶智能人机交互方法

站点导航

APP 下载