摘要
本公开提供了一种样本生成方法及程序产品,涉及计算机技术领域。该方法包括:调用大语言模型基于种子对话样本生成N个候选样本,种子对话样本是用于训练和/或评估对话模型的对话实例;使用对比学习模型依次评估每个候选样本与正样本之间的相似度以及与负样本之间的距离,并基于上述与正样本之间的相似度以及与负样本之间的距离得到该候选样本的适配度值;按照适配度值由高到低的顺序,使用多样性过滤器从N个候选样本中挑选出M个目标样本。根据本公开实施例,能够基于少量种子对话样本大量生成样本,进而提升了样本获取的效率,降低了样本数据采集和标注的成本。
技术关键词
大语言模型
样本生成方法
种子
深度神经网络
过滤器
计算机程序产品
语义特征
多头注意力机制
BERT模型
风险
句法结构
学习方法
数据分布
标签
模板
覆盖率
关键词
系统为您推荐了相关专利信息
噪声检测模块
优化噪声
校正
噪声标签
深度神经网络
咨询系统
大语言模型
患者健康
数据收集模块
输出模块
大语言模型
模型训练方法
计算机程序产品
样本
处理器
预警方法
鱼眼摄像头
广角摄像头
图像
深度神经网络模型