摘要
本申请涉及自然语言处理和决策智能领域,尤其涉及一种基于时序差分学习与规则增强的大语言模型推理方法,该方法广泛应用于自动规划、智能问答、具身智能等场景。包括:任务轨迹采样、领域知识归纳、领域规则抽取以及基于规则增强的大语言模型推理:对于测试任务数据,基于向量检索匹配最相关的历史任务,并获取对应任务的领域规则集;通过大语言模型自身进行规则自然语言重写,使其更具可解释性和适应性;最终将优化后的规则集成到大语言模型推理提示文本中,以优化推理质量和稳定性。
技术关键词
大语言模型
轨迹
规则集
推理方法
语义
时序
自然语言
向量检索方法
决策
代表
计算方法
误差方法
文本
参数
场景
规划
关系
逻辑
数据
因子
系统为您推荐了相关专利信息
多层感知机
自然语言
信息检索
文本
训练语言模型
地图构建方法
激光点云数据
点云地图
卡尔曼滤波器
时间同步
长短期记忆模型
马尔可夫模型
链路分析方法
问答知识库
文本