摘要
本公开涉及一种样本数据合成方法、装置、设备及介质。包括:获取目标场景对应的原始样本数据,并确定目标场景的主题类型;利用预设大型语言模型,对原始样本数据进行数据合成处理,生成第一样本合成数据;利用预设生成对抗网络,按照主题类型对第一样本合成数据进行数据合成处理,生成第二样本合成数据;基于第一样本合成数据和第二样本合成数据,得到目标场景对应的目标合成样本。这样,利用预设大型语言模型和预设生成对抗网络,自动合成与原始样本属于同一主题类型的合成样本,规避了合成样本与原始样本出现偏差的问题,提高了合成样本的生成质量和效率。
技术关键词
样本
生成对抗网络
数据
主题
场景
大语言模型
编码特征
模版
文本
特征提取模块
参数
处理器
可读存储介质
指令
存储器
解码器
编码器
电子设备
系统为您推荐了相关专利信息
自动化评估方法
大语言模型
摘要
自动化评估系统
生成代码
资源优化配置方法
三维可视化模型
数据
序列
矿山开采工艺
文书生成方法
案件数据
案例库
模板
法律知识图谱