摘要
本发明涉及人工智能技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种多模态语义图谱引导的决策方法、装置、设备及介质,包括:获取视觉、文本和动作数据,提取视觉特征向量、语言特征向量和动作特征向量并拼接生成多模态初始特征,映射至共享语义空间,构建多模态语义图谱并输入图谱引导的注意力机制生成跨模态对齐特征,跨模态对齐特征与任务目标输入元学习器生成任务适应性特征,任务适应性特征输入并行推理网络并行执行子任务,门控融合网络整合输出结果生成全局决策。本发明通过共享语义空间映射、图谱引导注意力和元学习器结合,增强跨模态语义关联和任务适应性,结合并行推理和门控融合,提升多模态决策的准确性与效率。
技术关键词
语义图谱
多模态
决策方法
跨模态
语义特征
视觉推理
推理网络
学习器
语义角色信息
句法依存关系
节点
消息传递机制
注意力机制
空间分布特征
文本
动作传感器
数据
系统为您推荐了相关专利信息
燃气轮机运行状态
回归预测方法
实时数据
异构
矩阵
泥石流预警系统
泥石流预警方法
交叉注意力机制
摄像头组件
子模块
智能问答方法
水利
识别用户意图
生成答案
语义特征
果品表面
图像分析技术
矩阵
空洞卷积神经网络
语义特征提取