摘要
本说明书一个或多个实施例提供一种模型迭代训练方法、样本扩充方法、设备、介质及产品。模型迭代训练方法包括:获取目标数据集,并将目标数据集拆分为训练集和验证集;目标数据集包括多个问题及符合预设安全规范的答复;基于训练集对待训练语言模型进行训练,获得训练好的目标语言模型;利用目标语言模型生成验证集中的问题的待评估答复;利用已训练完成的答复评估模型评估待评估答复是否符合预设安全规范,并在得出不符合结论时,输出用于描述待评估答复中的违规内容的分析信息;利用已训练完成的样本生成模型,生成能够规避分析信息描述的违规内容的问答对样本;基于问答对样本更新目标数据集,以用于下一次针对目标语言模型的迭代训练。
技术关键词
模型迭代训练方法
样本
训练语言模型
生成提示词
模板
场景
数据
矩阵
训练集
处理器
指令
计算机程序产品
可读存储介质
关键词
参数
电子设备
存储器
标签
系统为您推荐了相关专利信息
运维知识图谱
设备状态数据
动态报警阈值
智慧运维系统
关键故障特征
入侵检测模型
空间特征提取
特征提取模块
服务器
注意力
钓鱼网页检测方法
字符
高维向量空间
文本
语义特征
深度神经网络模型
掩码矩阵
边缘提取算法
梯度更新方法
水印