基于误差外推与推理链分析的训练数据合成方法、设备、介质及程序产品

正文

推荐专利

申请号：CN202511122425

申请日期：2025-08-12

公开号：CN120611192B

公开日期：2025-10-17

类型：发明专利

摘要

本申请提供一种基于误差外推与推理链分析的训练数据合成方法、设备、介质及程序产品，包括：获取初始样本集合；利用小语言模型对每个任务样本的问题进行多次采样推理，生成多个推理链；基于预设误差评估规则计算每个推理链的整体误差评分，确定待修正推理链；将待修正推理链与对应问题一并输入至大语言模型中，生成经修正的回答；将问题与经修正的回答构成新任务样本，对小语言模型进行部分参数微调；重复执行上述流程，直至模型在任务测评集上的性能指标变化率低于预设阈值，输出最终任务样本；将多个最终任务样本构成训练样本集，对小语言模型进行全参数微调。本申请以模型误差为导向构建训练数据自我优化路径，提升了语义一致性与数据有效性。

技术关键词

节点有向无环图计算机程序指令大语言模型训练样本集数据动态语义置信度阈值模型误差逻辑计算机程序产品处理器电子设备答案自然语言参数

系统为您推荐了相关专利信息

云原生架构的软交换资源弹性调度方法、装置、设备及介质

弹性调度方法生成资源资源特征软交换多维特征向量

基于场景自适应的电子围栏生成方法、装置、设备及介质

区域位置信息实时图像电子围栏生成方法定位策略婴幼儿床

基于代驾轨迹识别的智能计价管理平台

导航路径规划动态路径规划计价系统路径规划系统位置更新

换流阀的重启优化方法、电子设备及计算机可读存储介质

振动特征计算机程序指令电流可读存储介质信号

客服语音质量管理方法及装置

客服文本会话 BERT模型语音特征

基于误差外推与推理链分析的训练数据合成方法、设备、介质及程序产品

站点导航

APP 下载