摘要
本发明公开了一种针对电力行业大模型样例优化的对抗训练方法及系统,属于自然语言处理技术领域,所述方法具体为:收集错误样例并标注对应的第一答案,调整大语言模型以生成第二答案输出,构建训练数据集;在大语言模型的嵌入层和Transformer层加入扰动,基于Token级别扰动的二范数动态选择敏感Token施加扰动;基于得到的训练数据集,对大语言模型的输入进行前向传播,计算第一答案和第二答案的损失;通过反向传播更新扰动方向,根据第一答案和第二答案的损失动态调整施加的Token级别扰动;依据大语言模型正确输入计算交叉熵进行对抗训练。
技术关键词
答案
大语言模型
对抗训练系统
动态
噪声强度
随机噪声
数据模块
样本
程序
自然语言
可读存储介质
存储器
处理器
参数
指令
列表
计算机
代表