摘要
本发明公开了一种基于视觉语言模型的模型推理方法及装置,涉及人工智能技术领域。所述方法包括:对待推理文本和待推理图像进行编码,生成初始推理树;基于推理动作在待推理图像中的可行性参数以及当前节点的状态参数,对初始推理树进行扩展更新处理,生成目标推理树;基于目标推理树中所有结束节点的合理性参数,确定出候选推理路径;根据候选推理路径中的中间节点的一致性参数以及结束节点的合理性参数,确定目标推理路径,最后通过目标推理路径输出目标响应数据。本发明可以提升视觉语言模型在复杂推理任务中的推理效率及准确性。
技术关键词
节点
参数
视觉
图像
推理方法
数据
文本
摘要
推理装置
人工智能技术
聚类
模块
模板
编码
基础
逻辑
系统为您推荐了相关专利信息
机器人手眼
机器人基坐标系
机器人基座
串联机器人
标定算法
功率
温度预测方法
温度预测模型
储能系统
储能设备电池
智能运维管理方法
电力线路设备
轨道交通牵引设备
指标
展示设备