摘要
本发明涉及数据处理技术领域,特别是指一种基于大语言模型先验知识的推理状态控制方法及装置,该方法应用于自动驾驶离散化导航问题、集装箱堆叠问题、货物码放问题和自然语言文本下的文字数值计算问题,方法包括:获取无人系统决策推理的样本数据集;使用样本数据集、以及由ATE因果效应估计算法与交叉熵组成的损失函数,对初始的大语言模型进行训练;获取长程行动决策问题,构建因果概率树,确定剪枝和展开方向的优化问题,进而将长程行动决策问题切分为多个短程行动决策问题;使用训练好的大语言决策推理模型对多个短程行动决策问题进行求解,进而完成行动。采用本发明,可以解决大语言模型在长程推理任务中因果幻觉的问题,提高了推理的准确性。
技术关键词
集装箱堆叠
自然语言文本
样本
大语言模型
状态控制方法
估计算法
状态控制装置
决策
计算机可读取存储介质
状态控制设备
坐标
计算机可读指令
答案
效应
数据格式
定义
数据处理技术
系统为您推荐了相关专利信息
光伏组件隐裂
RBF神经网络
加权欧氏距离
故障诊断模型
故障诊断方法
时序
机器人控制
机械臂机器人
学习方法
特征提取网络