模型训练数据的生成方法、装置、设备、介质和程序产品

AITNT
正文
推荐专利
模型训练数据的生成方法、装置、设备、介质和程序产品
申请号:CN202510963687
申请日期:2025-07-14
公开号:CN120447886B
公开日期:2025-11-14
类型:发明专利
摘要
本发明提供一种模型训练数据的生成方法、装置、设备、介质和程序产品,涉及计算机技术领域,该方法包括:基于代码变更文件的变更记录从代码变更文件中提取多个最小修改单元;基于代码变更文件的结构化信息以及各最小修改单元在代码变更文件中的位置信息,确定各最小修改单元对应的修改类型;基于各最小修改单元对应的修改类型以及各最小修改单元的修改内容,生成代码编辑模型的训练数据。本发明通过解析代码变更记录,提取最小修改单元,并将其映射到对应的语法结构和修改类型,实现高效地生成覆盖项目级代码编辑场景的训练数据,使代码编辑模型能够学习项目级代码编辑的能力,同时具备自动化、上下文感知的联动修改能力,从而提高代码编辑效率。
技术关键词
生成方法 生成代码 数据 编辑 语法结构 元素 处理器 计算机程序产品 生成装置 项目 模块 存储器 电子设备 介质 语义 场景 定义
系统为您推荐了相关专利信息
1
独立地训练神经网络
训练神经网络 处理器 电路 数据
2
曝光装置和图像形成装置
发光芯片 发光元件 传输单元 周期 信号生成单元
3
模型获取方法、标题信息识别方法、相关装置及相关系统
模型获取方法 文本 信息识别方法 位置识别 信息识别装置
4
基于大语言模型的最小化修改程序修复方法、装置及系统和存储介质
大语言模型 程序修复方法 抽象语法树 程序修复系统 多层堆叠层
5
一种基于神经网络的TSV测试分组方法
超大规模集成电路测试技术 分组算法 梯度下降法 定义 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号