一种基于蒙特卡洛树搜索的大模型自适应推理方法

正文

推荐专利

申请号：CN202510040263

申请日期：2025-01-10

公开号：CN119831050A

公开日期：2025-04-15

类型：发明专利

摘要

本发明涉及一种基于蒙特卡洛树搜索的大模型自适应推理方法，步骤如下：采用树状结构组织大语言模型的推理过程；使用UCT算法选择待扩展的节点；在扩展新节点时，针对当前选择的节点使用当前推理路径上的所有信息生成下一步推理步骤；执行模拟，基于已有推理步骤继续推理直至得到最终答案，并判断最终答案是否正确；根据正确的最终答案进行反向传播，对当前推理路径上的节点进行奖励更新后，将生成新节点之前的树结构作为提示词，根据提示词生成的节点作为生成数据；依据生成数据对所述大模型进行微调；使用PPO算法对大模型进行强化学习。本发明可以根据当前推理状态自行选择父节点并向节点中添加新的推理节点，最终生成一个较为准确合理的答案。

技术关键词

蒙特卡洛树搜索推理方法节点 UCT算法答案树状结构大语言模型数据组织关系

系统为您推荐了相关专利信息

一种用于信息系统集成服务展示的产业链图谱构建方法

图谱构建方法关联规则挖掘算法企业信息系统电子产品

一种多源情报驱动的端网协同攻击防御方法

攻击防御方法网络安全设备节点融合特征注意力

模型压缩方法、装置及电子设备

模型压缩方法注意力非易失性存储介质矩阵模块

一种基于群智能搜索算法优化BP神经网络的表面粗糙度预测方法

优化BP神经网络智能搜索算法训练神经网络节点数多层前馈神经网络

一种基于海洋环境信息的海洋生态大数据分析方法

大数据分析方法海洋环境信息海洋环境数据权重模型模型库

一种基于蒙特卡洛树搜索的大模型自适应推理方法

站点导航

APP 下载