样本生成方法及程序产品

正文

推荐专利

样本生成方法及程序产品

申请号：CN202510984315

申请日期：2025-07-16

公开号：CN120849952A

公开日期：2025-10-28

类型：发明专利

摘要

本公开提供了一种样本生成方法及程序产品，涉及计算机技术领域。该方法包括：调用大语言模型基于种子对话样本生成N个候选样本，种子对话样本是用于训练和/或评估对话模型的对话实例；使用对比学习模型依次评估每个候选样本与正样本之间的相似度以及与负样本之间的距离，并基于上述与正样本之间的相似度以及与负样本之间的距离得到该候选样本的适配度值；按照适配度值由高到低的顺序，使用多样性过滤器从N个候选样本中挑选出M个目标样本。根据本公开实施例，能够基于少量种子对话样本大量生成样本，进而提升了样本获取的效率，降低了样本数据采集和标注的成本。

技术关键词

大语言模型样本生成方法种子深度神经网络过滤器计算机程序产品语义特征多头注意力机制 BERT模型风险句法结构学习方法数据分布标签模板覆盖率关键词

系统为您推荐了相关专利信息

一种基于演示视频模仿学习的机械臂智能控制方法

关键点特征大语言模型视频智能控制方法物体

一种用于医学图像分析的协同辅助标签校正方法

噪声检测模块优化噪声校正噪声标签深度神经网络

一种基于大语言模型的患者健康教育和咨询系统

咨询系统大语言模型患者健康数据收集模块输出模块

信息确定、模型训练方法、装置、设备、存储介质及计算机程序产品

大语言模型模型训练方法计算机程序产品样本处理器

一种商用车侧向盲区预警方法、装置、设备及介质

预警方法鱼眼摄像头广角摄像头图像深度神经网络模型

样本生成方法及程序产品

站点导航

APP 下载