基于时序差分学习与规则增强的大语言模型推理方法

正文

推荐专利

申请号：CN202510409596

申请日期：2025-04-02

公开号：CN120409667A

公开日期：2025-08-01

类型：发明专利

摘要

本申请涉及自然语言处理和决策智能领域，尤其涉及一种基于时序差分学习与规则增强的大语言模型推理方法，该方法广泛应用于自动规划、智能问答、具身智能等场景。包括：任务轨迹采样、领域知识归纳、领域规则抽取以及基于规则增强的大语言模型推理：对于测试任务数据，基于向量检索匹配最相关的历史任务，并获取对应任务的领域规则集；通过大语言模型自身进行规则自然语言重写，使其更具可解释性和适应性；最终将优化后的规则集成到大语言模型推理提示文本中，以优化推理质量和稳定性。

技术关键词

大语言模型轨迹规则集推理方法语义时序自然语言向量检索方法决策代表计算方法误差方法文本参数场景规划关系逻辑数据因子

系统为您推荐了相关专利信息

一种检索增强生成的方法

多层感知机自然语言信息检索文本训练语言模型

一种氨燃料动力集装箱船泄漏风险评估方法、装置及设备

集装箱船风险评估方法编码燃料氨气

激光与惯性融合的点云地图构建方法及装备

地图构建方法激光点云数据点云地图卡尔曼滤波器时间同步

一种代码克隆检测方法、装置、设备、介质及产品

代码克隆检测方法大语言模型摘要数据语义

保险作业流程全链路分析方法、装置、设备及介质

长短期记忆模型马尔可夫模型链路分析方法问答知识库文本

基于时序差分学习与规则增强的大语言模型推理方法

站点导航

APP 下载