摘要
本发明公开了一种操控训练能耗的对抗攻击方法及装置,涉及人工智能安全领域。用以解决因缺少分析理解操纵训练能耗的对抗攻击原理和设计检测防御策略,导致加剧大模型训练能源开销的问题。该方法包括:训练数据样本和待训练大模型,确定待训练大模型的当前梯度值、上个迭代的梯度值以及梯度差;根据优化算法更新对抗扰动时,若最优对抗扰动满足最大化上层优化目标函数,则根据训练数据样本和对抗扰动得到扰动样本;若当前梯度值与待训练大模型的目标函数关于待训练大模型的权重参数的梯度值相等时,根据待训练大模型的损失函数最小化寻优确定待训练大模型的最优权重参数。
技术关键词
样本
视频录制设备
因子
企业内部数据
音频采集设备
数据采集接口
爬取技术
数据传输接口
图像采集设备
参数
文本识别
计算机视觉
传播算法
能耗
自然语言
计算机设备
系统为您推荐了相关专利信息
深度学习网络模型
多分辨率特征
辐射源
指纹识别方法
序列
巡检图像
变电站设备
识别方法
识别设备
文本数据提取
客户端
节点
特征协方差矩阵
智能合约管理
统计特征
Graves眼病
生物标志物
试剂盒
血清
定量检测方法
能耗预测方法
样本
电力资源管理
状态估计器
电力设备运行状态