一种优化小型模型中代码思维链生成的方法

正文

推荐专利

一种优化小型模型中代码思维链生成的方法

申请号：CN202510274280

申请日期：2025-03-10

公开号：CN120218176B

公开日期：2025-12-23

类型：发明专利

摘要

本发明提供了一种优化小型模型中代码思维链生成的方法，属于计算机领域。解决了代码生成任务中在资源受限环境下难以利用大语言模型生成高质量思维链的技术问题。其技术方案为：包括以下步骤：S1：利用三个高性能的大型语言模型作为教师模型以构建数据集；S2：利用词汇剪枝技术作为参数减少策略优化基础模型参数；S3：利用分治策略分别训练子模型并合并后微调，得到COTTON_lite模型；S4：通过将COTTON_lite模型部署在单GPU硬件上以生成高质量思维链。本发明的有益效果为：本发明提出的方法仅使用0.38B参数的模型，高质量生成思维链指导代码生成。

技术关键词

大语言模型资源受限环境数据训练语料库分治策略剪枝技术基础教师频率标记高性能参数训练集样本有效性阶段格式机制定义

一种优化小型模型中代码思维链生成的方法

站点导航

APP 下载