摘要
本申请提供一种基于误差外推与推理链分析的训练数据合成方法、设备、介质及程序产品,包括:获取初始样本集合;利用小语言模型对每个任务样本的问题进行多次采样推理,生成多个推理链;基于预设误差评估规则计算每个推理链的整体误差评分,确定待修正推理链;将待修正推理链与对应问题一并输入至大语言模型中,生成经修正的回答;将问题与经修正的回答构成新任务样本,对小语言模型进行部分参数微调;重复执行上述流程,直至模型在任务测评集上的性能指标变化率低于预设阈值,输出最终任务样本;将多个最终任务样本构成训练样本集,对小语言模型进行全参数微调。本申请以模型误差为导向构建训练数据自我优化路径,提升了语义一致性与数据有效性。
技术关键词
节点
有向无环图
计算机程序指令
大语言模型
训练样本集
数据
动态
语义
置信度阈值
模型误差
逻辑
计算机程序产品
处理器
电子设备
答案
自然语言
参数
系统为您推荐了相关专利信息
弹性调度方法
生成资源
资源特征
软交换
多维特征向量
区域位置信息
实时图像
电子围栏生成方法
定位策略
婴幼儿床
导航路径规划
动态路径规划
计价系统
路径规划系统
位置更新
振动特征
计算机程序指令
电流
可读存储介质
信号