一种迭代式监督微调数据生成方法及系统

AITNT
正文
推荐专利
一种迭代式监督微调数据生成方法及系统
申请号:CN202510893844
申请日期:2025-06-30
公开号:CN120874946A
公开日期:2025-10-31
类型:发明专利
摘要
本申请公开了一种迭代式监督微调数据生成方法及系统,涉及人工智能、数据处理技术,包括:基于预训练语言模型生成基础训练数据对,所述基础训练数据对包括指令‑响应对;基于基础训练数据对进行模型训练,并根据模型在验证集及任务指标上的表现,确定训练性能反馈数据;根据所确定的训练性能反馈数据,解析模型性能指标;基于模型性能指标以及基础训练数据对,预测并优化训练数据以及训练参数的优化策略;根据优化的训练数据以及训练参数进行模型训练,以在训练后利用模型输出的策略执行AI模型训练平台数据生成。本申请引入模型性能反馈、自动任务挖掘与样本优化机制,动态调整和扩充训练数据,实现数据生成的闭环迭代与性能导向式优化。
技术关键词
数据生成方法 预训练语言模型 优化训练数据 样本 数据生成系统 策略 微调机制 参数 聚类技术 指标 生成机制 数据处理技术 生成场景 语义标签 模板 指令 多阶段
系统为您推荐了相关专利信息
1
一种巷道呼吸风险区域微小粉尘数目定量化预测方法
微小粉尘 BP神经网络 FLUENT软件 煤矿掘进通风技术 预测误差
2
考虑动态温度影响的锂离子电池剩余寿命预测方法
锂离子电池容量 状态空间模型 退化模型 概率密度函数 粒子
3
一种基于扩散模型进行文本引导可控人像生成方法及系统
人像生成方法 面部关键点 文本 去噪模型 噪声预测
4
一种融合改进GRU网络和贝叶斯滤波的电池SOC估计方法
GRU神经网络 贝叶斯滤波 灰狼算法 锂离子电池 神经网络模型
5
一种高计数率条件下的中子伽马脉冲波形堆叠甄别方法
堆叠方式 波形甄别方法 训练神经网络 脉冲 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号