摘要
本发明涉及软件测试技术领域,公开了基于反馈强化学习的单元测试用例生成大模型微调方法,包括:构建基于需求驱动的单元测试微调数据集;构建Actor模型,并通过需求驱动的单元测试微调数据集进行优化;构建Critic模型,并通过需求驱动的单元测试微调数据集进行优化;基于优化后的Actor模型生成单元测试用例,基于优化后的Critic模型将单元测试用例映射为单一即时奖励,通过强化学习得到基于单元测试用例生成的大模型。本发明构建了一个能够自动生成高质量、需求对齐、风格一致的单元测试用例生成方法,显著提升了测试效率与质量,打破了传统测试生成在人工依赖、覆盖深度和需求一致性上的瓶颈。
技术关键词
单元测试用例
微调方法
Actor模型
生成测试用例
联合损失函数
排序损失
数据
Sigmoid函数
代表
软件测试技术
序列
策略更新
编码器
注意力机制
格式
生成方法
参数
指标