摘要
本发明提供一种模型训练数据的生成方法、装置、设备、介质和程序产品,涉及计算机技术领域,该方法包括:基于代码变更文件的变更记录从代码变更文件中提取多个最小修改单元;基于代码变更文件的结构化信息以及各最小修改单元在代码变更文件中的位置信息,确定各最小修改单元对应的修改类型;基于各最小修改单元对应的修改类型以及各最小修改单元的修改内容,生成代码编辑模型的训练数据。本发明通过解析代码变更记录,提取最小修改单元,并将其映射到对应的语法结构和修改类型,实现高效地生成覆盖项目级代码编辑场景的训练数据,使代码编辑模型能够学习项目级代码编辑的能力,同时具备自动化、上下文感知的联动修改能力,从而提高代码编辑效率。
技术关键词
生成方法
生成代码
数据
编辑
语法结构
元素
处理器
计算机程序产品
生成装置
项目
模块
存储器
电子设备
介质
语义
场景
定义
系统为您推荐了相关专利信息
模型获取方法
文本
信息识别方法
位置识别
信息识别装置
大语言模型
程序修复方法
抽象语法树
程序修复系统
多层堆叠层
超大规模集成电路测试技术
分组算法
梯度下降法
定义
矩阵