摘要
本申请涉及人工智能技术领域,应用于机器人任务执行、金融科技、智能问诊等场景中,可以实现全面、深入地构建数据的语义信息以及不同模态的数据之间的相互关系,以及实现高效地对不同模态的语义信息进行深度交互与协同推理,从而有效提升理解复杂语义的准确性。涉及一种基于VLA模型的任务处理方法、装置、计算机设备和存储介质,该方法包括:获取多模态处理任务对应的多模态数据;基于动态语义图生成层,对多模态数据进行语义图生成,得到多模态数据对应的多模态动态语义图;基于跨模态协同推理层,对多模态动态语义图进行跨模态协同推理,得到多模态数据对应的目标语义信息;根据目标语义信息执行多模态处理任务。
技术关键词
多模态
跨模态
动态
语义场景
视觉特征提取
节点
依存句法关系
物体
计算机设备
消息传递机制
路径规划算法
语义角色
可读存储介质
存储计算机程序
人工智能技术
实例分割
数据获取模块