一种训练数据生成方法、设备、装置、介质及产品

AITNT
正文
推荐专利
一种训练数据生成方法、设备、装置、介质及产品
申请号:CN202510652078
申请日期:2025-05-20
公开号:CN120597965A
公开日期:2025-09-05
类型:发明专利
摘要
本申请提供一种训练数据生成方法、设备、装置、介质及产品。根据本申请的一个示例,该方法可以包括:利用训练数据集对初始模型进行预训练,得到预训练模型;利用预训练模型,生成针对输入指令的输出结果;在输出结果与输入指令对应的目标结果存在差异的情况下,基于输出结果和训练数据集中各个训练数据之间的关联程度,确定各个训练数据的数据质量;根据数据质量对各个训练数据进行筛选,生成新的训练数据集,通过预训练模型生成输出结果并评估其与训练数据的关联程度,能够自动量化训练数据的质量,基于数据质量动态筛选生成新的训练数据集,从而高效生成高质量的训练数据。
技术关键词
预训练模型 训练数据生成方法 数据生成模型 生成指令 清洗规则 生成模板 数据生成装置 处理器 校验规则 计算机程序产品 风险 数据格式 可读存储介质 多模态 模块 电子设备
系统为您推荐了相关专利信息
1
构建餐后血糖预测模型、预测餐后血糖的方法和装置
餐后血糖 饮食结构 预训练模型 训练机器学习模型 样本
2
一种基于CLIP模型的异常检测方法
异常检测方法 样本 双线性插值方法 局部视觉特征 像素
3
电子菜谱的生成方法和装置、电子设备及存储介质
电子菜谱 参数 菜谱生成系统 模板 数据模型构造
4
一种基于多模态数据融合的儿童呕吐数据采集方法及系统
心率 多模态数据融合 可视化数据集 意图 三轴加速度数据
5
模型微调数据集的处理方法、装置、电子设备及可读介质
数据 预训练模型 通信接口 电子设备 处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号