摘要
本发明涉及机器学习领域,具体为一种基于指纹成员概率偏移信号的大语言模型版权保护方法和设备,构建指纹数据集,将指纹数据集对称划分为训练子集和参考子集;利用参考子集对原始模型微调训练,得到参考模型;根据训练子集,生成语义等价扰动样本集;根据语义等价扰动样本集,计算待验证模型和参考模型各自的概率偏移指标;根据待验证模型和参考模型各自概率偏移指标,确定指纹数据集的平均信号强度指标;根据平均信号强度指标,判断待验证模型是否构成侵权。本发明能够实现大语言模型泄露后在灰盒或黑盒场景下的隐蔽、高效、准确且高鲁棒性的模型版权验证。
技术关键词
指纹
版权保护方法
指标
样本
语义
自然语言文本
大语言模型
模块
多策略
数据分布
信号
适配器
鲁棒性
校准
场景
模式
系统为您推荐了相关专利信息
智能测量方法
多层感知机
体重预测
样本
分类阈值
图像修复方法
隐马尔可夫模型
多模态
遮挡关系
依赖特征
医学图像分割方法
医学图像分割模型
状态空间模型
识别模块
语义特征