一种基于大语言模型先验知识的推理状态控制方法及装置

正文

推荐专利

申请号：CN202410851175

申请日期：2024-06-28

公开号：CN118446322B

公开日期：2025-02-11

类型：发明专利

摘要

本发明涉及数据处理技术领域，特别是指一种基于大语言模型先验知识的推理状态控制方法及装置，该方法应用于自动驾驶离散化导航问题、集装箱堆叠问题、货物码放问题和自然语言文本下的文字数值计算问题，方法包括：获取无人系统决策推理的样本数据集；使用样本数据集、以及由ATE因果效应估计算法与交叉熵组成的损失函数，对初始的大语言模型进行训练；获取长程行动决策问题，构建因果概率树，确定剪枝和展开方向的优化问题，进而将长程行动决策问题切分为多个短程行动决策问题；使用训练好的大语言决策推理模型对多个短程行动决策问题进行求解，进而完成行动。采用本发明，可以解决大语言模型在长程推理任务中因果幻觉的问题，提高了推理的准确性。

技术关键词

集装箱堆叠自然语言文本样本大语言模型状态控制方法估计算法状态控制装置决策计算机可读取存储介质状态控制设备坐标计算机可读指令答案效应数据格式定义数据处理技术

系统为您推荐了相关专利信息

BEV模型训练方法、装置、电子设备及可读存储介质

样本模型训练方法标签矩阵网络

一种基于三代测序用于HLA进行自动分析分型的方法

数据扩增子基因测序芯片测序技术

一种基于RBF神经网络的光伏组件隐裂故障诊断方法

光伏组件隐裂 RBF神经网络加权欧氏距离故障诊断模型故障诊断方法

机器人技能学习方法、装置、机械臂机器人及存储介质

时序机器人控制机械臂机器人学习方法特征提取网络

结合光缆侵扰事件特征分析的光缆运维系统及方法

光缆地面监测平台事件特征运维方法算法模型

一种基于大语言模型先验知识的推理状态控制方法及装置

站点导航

APP 下载