一种提升模型推理效果的方法

正文

推荐专利

一种提升模型推理效果的方法

申请号：CN202510523731

申请日期：2025-04-24

公开号：CN120450038A

公开日期：2025-08-08

类型：发明专利

摘要

本发明涉及一种提升模型推理效果的方法，包括以下步骤：S1：引导大模型解决数学问题，大模型通过内部知识储备解答问题，当大模型判定当前问题无法通过内部知识储备解答时，由其自主触发外部检索机制，生成检索结果；S2：依据检索结果，继续引导大模型解决数学问题；S3：循环S1和S2，直至搜索引擎调用预算耗尽，或，大模型生成包含指定答案令牌的完整解答响应；S4：构建基于强化学习的优化框架，通过策略梯度算法对大模型解题行为进行动态校正。本发明采用邻近策略优化和分组相对策略优化的优势，优化检索增强推理。

技术关键词

梯度算法动态校正令牌数学策略答案机制框架标记包裹序列

系统为您推荐了相关专利信息

装配式锚索框架梁加固边坡设计方法及系统、设备、介质

锚索框架梁加固装配式框架梁边坡历史监测数据参数

一种基于AME-TD3算法的热电联产系统控制策略

热电联产系统控制策略 CHP系统网络算法

基于AI目标识别的多任务并行处理方法及系统

系统上下文深度强化学习模型资源分配序列列表

一种电力通信系统调度方法及装置

融合特征基站多模态系统调度方法功率分配策略

一种基于Deepseek强化学习的铁路行业问答方法及系统

铁路问答模型问答方法数据基座

一种提升模型推理效果的方法

站点导航

APP 下载