摘要
本发明提供一种基于蒙特卡洛树搜索的代码大模型自我进化方法,包括:S1:将代码生成任务输入预训练推理模型,根据推理任务生成推理步骤;S2、构建推理树,根据改进的蒙特卡洛树搜索算法获得最优推理路径和奖励分数;S3、根据最优推理路径,基于自动生成的推理和奖励数据进行预训练模型自我进化提升推理模型;S4、让预训练模型生成推理方案的代码,训练预训练模型模型,得到代码大模型。本发明可以在不需要大量微调数据的情况下,有效地提升大模型代码生成的能力和准确性,还增强了模型在复杂推理任务中的自适应性。
技术关键词
进化方法
蒙特卡洛树搜索
搜索算法
预训练模型
逻辑
数据
节点
连续性
有效性
代表
复杂度
机制
系统为您推荐了相关专利信息
因子
神经网络模型
数据
卷积网络模型
行业景气指数
强化学习算法
广告
文本
网站访问记录
深度卷积神经网络
行车记录图像
预训练模型
识别兴趣点
列表
兴趣点名称