摘要
本申请提供了一种基于大模型的数学问题推理轨迹的生成方法和系统、设备,涉及人工智能技术领域。该方法将目标数学问题作为根节点,构建多层级推理树,利用蒙特卡洛树搜索算法进行路径搜索,搜索目标数学问题的推理轨迹,在搜索的过程中,针对每一层级上的多个候选解答步骤,采用概率路线图预测该层级上的各个候选解答步骤的探索概率;基于预测的各个候选解答步骤的探索概率,选取目标解答步骤作为采样节点进入到下一层级的搜索,最后生成目标数学问题的推理轨迹提供给用户。本实施例通过概率路线图的指导和蒙特卡洛树搜索算法的搜索策略,能够在第一轮迭代中快速找到高质量的目标数学问题的推理轨迹,显著提高推理轨迹的生成效率和质量。
技术关键词
概率路线图
数学
蒙特卡洛树
搜索算法
轨迹
节点
生成方法
层级
训练样本集
损失函数优化
微调方法
策略
基础
人工智能技术
计算机程序产品
生成系统
定义
解析单元
指令
参数
系统为您推荐了相关专利信息
关键点
深度神经网络
图像
样本
深度优先搜索算法
足底筋膜
检测识别方法
图像识别算法
追踪特征
跖趾关节
数学模型
仿真环境
调节阀
阀门气动执行器
智能阀门控制装置