基于多模态语义对齐的智能体自适应决策方法及装置

正文

推荐专利

申请号：CN202511038552

申请日期：2025-07-28

公开号：CN120542470B

公开日期：2025-10-03

类型：发明专利

摘要

本申请公开了一种基于多模态语义对齐的智能体自适应决策方法及装置，方法包括：通过多模态传感器阵列采集语音信息、视觉信息和触觉信息进行时间戳同步，得到时间对齐的多模态数据；根据预设分层注意力机制，将多模态数据进行细粒度语义对齐，得到统一语义表示，预设分层注意力机制包括模态内注意力层与跨模态注意力层，模态内注意力层用于捕捉多模态数据的依赖关系并基于依赖关系提取各模态数据内部的关键特征，跨模态注意力层用于根据关键特征对各模态数据进行语义对齐和语义融合；根据统一语义表示和预先训练的生成对抗网络，生成决策结果。因此，采用本申请实施例，智能体在执行任务时不会出现误解或错误操作，从而提升了智能体决策的准确性。

技术关键词

生成对抗网络语义分层注意力序列视觉触觉信息语音跨模态模态传感器决策方法注意力机制关系梅尔频率倒谱系数对抗性多模态数据采集数据处理机制

系统为您推荐了相关专利信息

一种基于机器视觉的特种泡沫表面缺陷分类检测方法

分类检测方法神经网络模型泡沫视觉检测技术图像采集设备

一种信道环境自适应的采样-语义-信道编码联合优化方法及系统

语义图像特征向量联合优化方法信道信噪比

一种基于多尺度图结构学习的多元时间序列异常检测方法与系统

多尺度样本序列注意力神经网络模块

一种基于多源数据融合的隐蔽致灾因素致灾风险评价方法

风险评价方法风险评估模型深度学习网络地貌特征数字高程模型

一种小样本油气管道事故实体识别方法

实体识别方法知识蒸馏技术预训练模型管道标签

基于多模态语义对齐的智能体自适应决策方法及装置

站点导航

APP 下载