样本生成方法及程序产品

AITNT
正文
推荐专利
样本生成方法及程序产品
申请号:CN202510984315
申请日期:2025-07-16
公开号:CN120849952A
公开日期:2025-10-28
类型:发明专利
摘要
本公开提供了一种样本生成方法及程序产品,涉及计算机技术领域。该方法包括:调用大语言模型基于种子对话样本生成N个候选样本,种子对话样本是用于训练和/或评估对话模型的对话实例;使用对比学习模型依次评估每个候选样本与正样本之间的相似度以及与负样本之间的距离,并基于上述与正样本之间的相似度以及与负样本之间的距离得到该候选样本的适配度值;按照适配度值由高到低的顺序,使用多样性过滤器从N个候选样本中挑选出M个目标样本。根据本公开实施例,能够基于少量种子对话样本大量生成样本,进而提升了样本获取的效率,降低了样本数据采集和标注的成本。
技术关键词
大语言模型 样本生成方法 种子 深度神经网络 过滤器 计算机程序产品 语义特征 多头注意力机制 BERT模型 风险 句法结构 学习方法 数据分布 标签 模板 覆盖率 关键词
系统为您推荐了相关专利信息
1
一种基于演示视频模仿学习的机械臂智能控制方法
关键点特征 大语言模型 视频 智能控制方法 物体
2
一种用于医学图像分析的协同辅助标签校正方法
噪声检测模块 优化噪声 校正 噪声标签 深度神经网络
3
一种基于大语言模型的患者健康教育和咨询系统
咨询系统 大语言模型 患者健康 数据收集模块 输出模块
4
信息确定、模型训练方法、装置、设备、存储介质及计算机程序产品
大语言模型 模型训练方法 计算机程序产品 样本 处理器
5
一种商用车侧向盲区预警方法、装置、设备及介质
预警方法 鱼眼摄像头 广角摄像头 图像 深度神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号