摘要
本发明公开了一种基于双层嵌套指纹的大语言模型知识产权保护方法和装置,属于模型安全技术领域,包括:构建指纹数据集,其包含四个相互正交的子集,分别为正常响应子集、双层嵌套触发指纹子集、风格触发指纹子集和语义触发指纹子集;利用指纹数据集对大语言模型在知识问答过程中进行嵌入学习得到指纹化模型,学习目标为保持正常响应子集的一致性、激活双层嵌套触发指纹子集的响应,和通过风格触发指纹子集和语义触发指纹子集的对抗学习来减少学习偏差;基于指纹数据集和指纹化模型,使用满足触发条件的双层嵌套触发器对任意嫌疑模型进行验权,提升双层嵌套指纹嵌入的隐蔽性、可靠性和有效性,切实保护大语言模型的知识产权版权。
技术关键词
语义特征
嵌套
大语言模型
保护方法
风格
指纹模型
数据
适配器
样本
参数
偏差
文本
指数
处理器
保护装置
可读存储介质
变量
存储器
系统为您推荐了相关专利信息
分子属性预测方法
属性预测模型
拓扑图
蒸馏
大语言模型
指纹生成方法
生成浏览器
语义特征提取
设备特征信息
格式
生态修复方法
策略标签
高层语义特征
多光谱传感器
深度特征学习
需求预测方法
动态邻接矩阵
充电站
大语言模型
道路结构