一种基于在线树搜索的训练方法、装置、设备及介质

AITNT
正文
推荐专利
一种基于在线树搜索的训练方法、装置、设备及介质
申请号:CN202510414845
申请日期:2025-04-03
公开号:CN120338059A
公开日期:2025-07-18
类型:发明专利
摘要
本发明涉及网络信息技术领域,尤其涉及一种基于在线树搜索的训练方法、装置、设备及介质,其中,方法包括:基于熵引导树搜索对给定提示信息进行初始化处理,生成引导树根;根据熵值选择引导树根的分叉点,对引导树的分叉点进行扩展处理,得到树结构;利用蒙特卡洛方法计算树结构中的节点值,基于树结构中的节点值计算奖励信号并强化树搜索策略模型。通过树搜索增强探索多样性,利用过程监督提高学习效率,形成一个闭环优化系统,显著提升大语言模型在数学、编程等复杂推理任务上的能力,具有广泛的应用价值。
技术关键词
蒙特卡洛方法 计算机执行指令 树根 节点 在线 策略 网络信息技术 可读存储介质 梯度方法 大语言模型 信号 令牌 训练装置 处理器通信 存储器 平方根 电子设备 模块
系统为您推荐了相关专利信息
1
基于机器人系统的任务处理方法、机器人系统及设备
多线程 执行器 机器人系统 节点 队列
2
一种电路板生产智能在线分析监测系统及其方法
在线分析监测系统 智能分析算法 电路板 图像采集模块 多光谱成像
3
台区水位动态预测方法、系统、设备及介质
动态预测方法 水位预测值 Attention机制 在线增量学习 GBDT模型
4
工程机械标定方法、装置、电子设备及工程机械
发动机 曲线 油泵 标定方法 电子设备
5
一种用于实景三维模型处理的集群批量优化调整系统
实景三维模型 三维网格模型 节点 集群 纹理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号