摘要
本发明涉及网络信息技术领域,特别涉及一种基于数据扩展的软件工程智能体构建方法及装置,其中,方法包括:获取软件工程数据集,并将软件工程数据集输入至目标大语言模型中,以生成结构化Gherkin场景对应的代码修复测试用例;利用代码修复测试用例对预设离线强化学习方法进行混合训练,以得到基于离线数据的修复策略模型;根据目标任务对基于离线数据的修复策略模型进行迭代扩展推理,以生成软件工程智能体。由此,解决了当前大语言模型应用于软件工程自动修复任务时因数据质量不足、训练数据匮乏和泛化性能有限等问题。
技术关键词
体构建方法
强化学习方法
大语言模型
离线
数据
策略
微调方法
仓库
场景
注意力机制
网络信息技术
项目
扩展单元
软件
处理器
模块
转换单元
可读存储介质
存储器
动态
系统为您推荐了相关专利信息
振动提醒功能
智能驾驶车辆
方向盘
智能驾驶系统
参数
远程调度系统
历史运行数据
实时监测数据
前馈神经网络
矿井
智能健康
分析系统
健康风险评估
数据加密技术
数据采集模块