一种提升模型推理效果的方法

AITNT
正文
推荐专利
一种提升模型推理效果的方法
申请号:CN202510523731
申请日期:2025-04-24
公开号:CN120450038A
公开日期:2025-08-08
类型:发明专利
摘要
本发明涉及一种提升模型推理效果的方法,包括以下步骤:S1:引导大模型解决数学问题,大模型通过内部知识储备解答问题,当大模型判定当前问题无法通过内部知识储备解答时,由其自主触发外部检索机制,生成检索结果;S2:依据检索结果,继续引导大模型解决数学问题;S3:循环S1和S2,直至搜索引擎调用预算耗尽,或,大模型生成包含指定答案令牌的完整解答响应;S4:构建基于强化学习的优化框架,通过策略梯度算法对大模型解题行为进行动态校正。本发明采用邻近策略优化和分组相对策略优化的优势,优化检索增强推理。
技术关键词
梯度算法 动态校正 令牌 数学 策略 答案 机制 框架 标记 包裹 序列
系统为您推荐了相关专利信息
1
装配式锚索框架梁加固边坡设计方法及系统、设备、介质
锚索框架梁加固 装配式框架梁 边坡 历史监测数据 参数
2
一种基于AME-TD3算法的热电联产系统控制策略
热电联产系统 控制策略 CHP系统 网络 算法
3
基于AI目标识别的多任务并行处理方法及系统
系统上下文 深度强化学习模型 资源分配 序列 列表
4
一种电力通信系统调度方法及装置
融合特征 基站 多模态 系统调度方法 功率分配策略
5
一种基于Deepseek强化学习的铁路行业问答方法及系统
铁路 问答模型 问答方法 数据 基座
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号