摘要
本发明公开了人工智能技术领域的一种具像化的大模型推理辅助方法,包括以下步骤:步骤一,输入问题:以原始问题的文本描述为输入,通过大语言模型对问题进行初步理解和分析;步骤二,规划阶段:识别阶段所需的关键元信息,元数据包括选择绘图工具和创建初始图像;步骤三,迭代推理阶段:根据语言模型给出的指令逐步更新图像,生成图文结合的思维链;步骤四,联合推理阶段:多模态大语言模型结合图像和文字信息,对整个思考过程进行解释和推理。本发明通过将抽象的推理问题具像化为图像,允许大语言模型接受问题的文本描述作为输入,并使用自我生成的图像作为增强推理的额外信息通道,能够减少先验知识的引入,从而提高方法的普适性。
技术关键词
大语言模型
绘图工具
阶段
多模态
生成图文
图像生成模型
文本
规划
提示技术
推理算法
人工智能技术
样本
数据
轨迹
模板
答案
指令
编程
格式
系统为您推荐了相关专利信息
动作识别方法
运动轨迹数据
约束特征
骨骼关键点
多尺度特征
大型充油设备
渗漏油检测系统
智能分析模块
智能路径规划
监控平台