一种基于蒙特卡洛树搜索的大模型自适应推理方法

AITNT
正文
推荐专利
一种基于蒙特卡洛树搜索的大模型自适应推理方法
申请号:CN202510040263
申请日期:2025-01-10
公开号:CN119831050A
公开日期:2025-04-15
类型:发明专利
摘要
本发明涉及一种基于蒙特卡洛树搜索的大模型自适应推理方法,步骤如下:采用树状结构组织大语言模型的推理过程;使用UCT算法选择待扩展的节点;在扩展新节点时,针对当前选择的节点使用当前推理路径上的所有信息生成下一步推理步骤;执行模拟,基于已有推理步骤继续推理直至得到最终答案,并判断最终答案是否正确;根据正确的最终答案进行反向传播,对当前推理路径上的节点进行奖励更新后,将生成新节点之前的树结构作为提示词,根据提示词生成的节点作为生成数据;依据生成数据对所述大模型进行微调;使用PPO算法对大模型进行强化学习。本发明可以根据当前推理状态自行选择父节点并向节点中添加新的推理节点,最终生成一个较为准确合理的答案。
技术关键词
蒙特卡洛树搜索 推理方法 节点 UCT算法 答案 树状结构 大语言模型 数据 组织 关系
系统为您推荐了相关专利信息
1
一种用于信息系统集成服务展示的产业链图谱构建方法
图谱构建方法 关联规则挖掘算法 企业 信息系统 电子产品
2
一种多源情报驱动的端网协同攻击防御方法
攻击防御方法 网络安全设备 节点 融合特征 注意力
3
模型压缩方法、装置及电子设备
模型压缩方法 注意力 非易失性存储介质 矩阵 模块
4
一种基于群智能搜索算法优化BP神经网络的表面粗糙度预测方法
优化BP神经网络 智能搜索算法 训练神经网络 节点数 多层前馈神经网络
5
一种基于海洋环境信息的海洋生态大数据分析方法
大数据分析方法 海洋环境信息 海洋环境数据 权重模型 模型库
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号