摘要
本申请提供一种训练数据生成方法、设备、装置、介质及产品。根据本申请的一个示例,该方法可以包括:利用训练数据集对初始模型进行预训练,得到预训练模型;利用预训练模型,生成针对输入指令的输出结果;在输出结果与输入指令对应的目标结果存在差异的情况下,基于输出结果和训练数据集中各个训练数据之间的关联程度,确定各个训练数据的数据质量;根据数据质量对各个训练数据进行筛选,生成新的训练数据集,通过预训练模型生成输出结果并评估其与训练数据的关联程度,能够自动量化训练数据的质量,基于数据质量动态筛选生成新的训练数据集,从而高效生成高质量的训练数据。
技术关键词
预训练模型
训练数据生成方法
数据生成模型
生成指令
清洗规则
生成模板
数据生成装置
处理器
校验规则
计算机程序产品
风险
数据格式
可读存储介质
多模态
模块
电子设备
系统为您推荐了相关专利信息
餐后血糖
饮食结构
预训练模型
训练机器学习模型
样本
异常检测方法
样本
双线性插值方法
局部视觉特征
像素
心率
多模态数据融合
可视化数据集
意图
三轴加速度数据