摘要
本发明属于信息处理技术领域,公开了基于异步因果推断反思的持续任务规划系统及方法,基于大语言模型,通过行动者模块,将任务目标和环境观察作为输入,预测下一步行动作为输出;通过关联推理模块从当前轨迹的环境观察中提取事物之间的关联信息,进行层级因果推断第一层次的因果推断,确定事物之间的关联性;通过干预计划生成模块根据反事实推理得到的新轨迹以及之前提取的关联信息进行层级因果推断第二层次的因果推断,生成下一次干预实施的计划,验证任务失败的原因;通过反事实推理模块根据任务目标、任务轨迹条件下重新生成任务轨迹进行层级因果推断第三层次的因果推断,确定前一次尝试失败的原因。显著提高了长期任务规划的成功率。
技术关键词
大语言模型
模块
轨迹
计划
规划系统
层级
注意力机制
环境状态信息
文本
推断物体
参数
信息处理技术
容器
贪婪算法
序列
决策
矩阵