摘要
本发明公开了一种基于幻觉上下文嵌入的大语言模型所有权认证方法和装置,属于模型所有权保护技术领域,包括:对采集的背景知识段落进行语义保持但事实扭曲的重写以构造幻觉上下文集合;针对每一幻觉上下文设计与原始主题一致的自然查询,形成(自然查询,幻觉上下文,幻觉答案标签)三元组,将三元组与正常数据混合构成指纹训练集;利用指纹训练集对目标大语言模型进行微调得到带有特定幻觉响应行为的指纹化模型;基于指纹数据集和指纹化模型,使用满足触发条件的幻觉上下文触发器对任意嫌疑模型进行验权,实现目标大语言模型所有权保护。本发明能够提升基于幻觉嵌入的自然性、隐蔽性、可靠性以及有效性,从而切实保护大语言模型的所有权版权。
技术关键词
大语言模型
认证方法
三元组
答案
主题
训练集
语义
标签
指纹特征
存储计算机程序
适配器
模块
认证装置
数据
度函数
样本
存储器
逻辑