一种基于蒙特卡洛树搜索的代码大模型自我进化方法

正文

推荐专利

申请号：CN202411524870

申请日期：2024-10-30

公开号：CN119398173B

公开日期：2025-10-10

类型：发明专利

摘要

本发明提供一种基于蒙特卡洛树搜索的代码大模型自我进化方法，包括：S1：将代码生成任务输入预训练推理模型，根据推理任务生成推理步骤；S2、构建推理树，根据改进的蒙特卡洛树搜索算法获得最优推理路径和奖励分数；S3、根据最优推理路径，基于自动生成的推理和奖励数据进行预训练模型自我进化提升推理模型；S4、让预训练模型生成推理方案的代码，训练预训练模型模型，得到代码大模型。本发明可以在不需要大量微调数据的情况下，有效地提升大模型代码生成的能力和准确性，还增强了模型在复杂推理任务中的自适应性。

技术关键词

进化方法蒙特卡洛树搜索搜索算法预训练模型逻辑数据节点连续性有效性代表复杂度机制

系统为您推荐了相关专利信息

基于拓扑基本原理增强的图对比学习方法和系统

节点数据训练分类器学习方法存储计算机程序

一种基于多维度因子的设备贷款还款期限预测方法及装置

因子神经网络模型数据卷积网络模型行业景气指数

一种计算机网络用户行为分析的方法

强化学习算法广告文本网站访问记录深度卷积神经网络

行车探索方法和装置

行车记录图像预训练模型识别兴趣点列表兴趣点名称

基于区块链的数据关系图谱构建展示方法及系统

节点展示方法图谱深度优先搜索算法关系网络

一种基于蒙特卡洛树搜索的代码大模型自我进化方法

站点导航

APP 下载