一种迭代式监督微调数据生成方法及系统

正文

推荐专利

一种迭代式监督微调数据生成方法及系统

申请号：CN202510893844

申请日期：2025-06-30

公开号：CN120874946A

公开日期：2025-10-31

类型：发明专利

摘要

本申请公开了一种迭代式监督微调数据生成方法及系统，涉及人工智能、数据处理技术，包括：基于预训练语言模型生成基础训练数据对，所述基础训练数据对包括指令‑响应对；基于基础训练数据对进行模型训练，并根据模型在验证集及任务指标上的表现，确定训练性能反馈数据；根据所确定的训练性能反馈数据，解析模型性能指标；基于模型性能指标以及基础训练数据对，预测并优化训练数据以及训练参数的优化策略；根据优化的训练数据以及训练参数进行模型训练，以在训练后利用模型输出的策略执行AI模型训练平台数据生成。本申请引入模型性能反馈、自动任务挖掘与样本优化机制，动态调整和扩充训练数据，实现数据生成的闭环迭代与性能导向式优化。

技术关键词

数据生成方法预训练语言模型优化训练数据样本数据生成系统策略微调机制参数聚类技术指标生成机制数据处理技术生成场景语义标签模板指令多阶段

系统为您推荐了相关专利信息

一种巷道呼吸风险区域微小粉尘数目定量化预测方法

微小粉尘 BP神经网络 FLUENT软件煤矿掘进通风技术预测误差

考虑动态温度影响的锂离子电池剩余寿命预测方法

锂离子电池容量状态空间模型退化模型概率密度函数粒子

一种基于扩散模型进行文本引导可控人像生成方法及系统

人像生成方法面部关键点文本去噪模型噪声预测

一种融合改进GRU网络和贝叶斯滤波的电池SOC估计方法

GRU神经网络贝叶斯滤波灰狼算法锂离子电池神经网络模型

一种高计数率条件下的中子伽马脉冲波形堆叠甄别方法

堆叠方式波形甄别方法训练神经网络脉冲数据

一种迭代式监督微调数据生成方法及系统

站点导航

APP 下载