摘要
本发明属于数据生成技术领域,提供一种基于电网客服大模型的数据生成方法及相关装置,所述方法包括:获取原始语句作为数据集,对数据集进行预处理,得到预处理后的数据集;对预处理后的数据集进行数据增强,得到数据增强后的数据集;将增强后的数据集通过语义约束和指标约束生成文本语句;将文本语句和原始语句作为深度神经网络的输入,输出文本语句和原始语句的相似度,根据相似度筛选出新语句作为数据集的新数据。本发明以生成高质量、符合实际应用需求的数据,降低数据获取成本,提升模型的鲁棒性和泛化能力,从而增强其在实际应用中的稳定性和高效性。
技术关键词
语句
数据生成方法
数据生成系统
客服
文本
语义
同义词
优化深度神经网络
数据处理工具
预训练语言模型
模拟键盘
数据生成技术
数据获取模块
指标
输出模块
字符
可读存储介质
噪声
系统为您推荐了相关专利信息
模型训练方法
大语言模型
图像
生成方法
噪声数据
资源调度策略
资源调度模型
资源调度信息
非易失性存储介质
文本