摘要
本申请公开了一种迭代式监督微调数据生成方法及系统,涉及人工智能、数据处理技术,包括:基于预训练语言模型生成基础训练数据对,所述基础训练数据对包括指令‑响应对;基于基础训练数据对进行模型训练,并根据模型在验证集及任务指标上的表现,确定训练性能反馈数据;根据所确定的训练性能反馈数据,解析模型性能指标;基于模型性能指标以及基础训练数据对,预测并优化训练数据以及训练参数的优化策略;根据优化的训练数据以及训练参数进行模型训练,以在训练后利用模型输出的策略执行AI模型训练平台数据生成。本申请引入模型性能反馈、自动任务挖掘与样本优化机制,动态调整和扩充训练数据,实现数据生成的闭环迭代与性能导向式优化。
技术关键词
数据生成方法
预训练语言模型
优化训练数据
样本
数据生成系统
策略
微调机制
参数
聚类技术
指标
生成机制
数据处理技术
生成场景
语义标签
模板
指令
多阶段
系统为您推荐了相关专利信息
微小粉尘
BP神经网络
FLUENT软件
煤矿掘进通风技术
预测误差
锂离子电池容量
状态空间模型
退化模型
概率密度函数
粒子
人像生成方法
面部关键点
文本
去噪模型
噪声预测
GRU神经网络
贝叶斯滤波
灰狼算法
锂离子电池
神经网络模型