一种基于蒙特卡洛树搜索的提升大语言模型推理能力方法

AITNT
正文
推荐专利
一种基于蒙特卡洛树搜索的提升大语言模型推理能力方法
申请号:CN202510040334
申请日期:2025-01-10
公开号:CN119831051A
公开日期:2025-04-15
类型:发明专利
摘要
本发明涉及一种基于蒙特卡洛树搜索的提升大语言模型推理能力方法,包括以下步骤:S1:预设数学问题集及对应标准答案;S2:将解决数学问题的每一个步骤当作一个树节点,整个解题过程生成蒙特卡洛树;S3:基于蒙特卡洛树搜索生成训练数据;S4:对生成的训练数据进行打分;S5:依据打分得到分数构造损失函数,优化该损失函数并更新大语言模型的参数。本发明可以提升大语言模型的推理能力。
技术关键词
蒙特卡洛树搜索 大语言模型 生成训练数据 节点 答案 数学 正确率 参数
系统为您推荐了相关专利信息
1
一种视频网关异构部署方法、装置、设备及存储介质
视频网关 集群 异构 主机 镜像
2
提升系统灵活性的梯级水电融合改造与网架规划协同方法
水电站 典型 场景 梯级水电 抽水蓄能机组
3
关联预测模型训练方法、关联预测方法及系统
预测模型训练方法 融合特征 多源特征 核糖核酸 关联预测方法
4
一种适用于低空经济的飞行器飞行时间控制方法
时间控制方法 风速 计算方法 多项式 飞行器控制技术
5
光伏接入电网系统的控制方法、装置、设备及存储介质
电网系统 数据 电网关键节点 光伏电站 递归神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号