摘要
本发明公开了一种训练样本数据生成方法、设备、可读存储介质及程序产品,涉及人工智能技术领域。其中,方法包括将编程语言处理任务的种子题目和提示词输入至样本数据生成模型;利用提示词基于同一算法思维对种子题目在修改范围边界条件内进行修改,根据新题目类型和用例生成条件生成覆盖新题目约束条件的测试用例集。对通过验证的新题目进行解答,并输出通过测试用例集验证的答案;将新题目、测试用例集和答案作为训练样本数据;调整修改范围边界条件和/或提示词和/或用例生成条件,利用新题目生成新的训练样本数据。本发明可以解决相关技术生成的训练数据无法满足模型训练需求的问题,能够高效为编程语言处理任务生成高质量的训练样本数据。
技术关键词
训练样本数据
测试用例集
数据生成模型
生成提示词
答案
生成方法
解题思路
种子
数据验证
单轮
输出提示词
模版
算法
复杂度
可读存储介质
存储计算机程序
人工智能技术
计算机程序产品
意图
系统为您推荐了相关专利信息
智能问答方法
表格
生成关键词
判断用户请求
智能问答装置
轨道交通运维
问答方法
轨道交通知识
构建轨道交通
轨道交通设备
训练样本数据
数据分类模型
电磁
计算机程序产品
时域特征
模型迭代训练方法
样本
训练语言模型
生成提示词
模板