摘要
本发明公开一种针对大语言模型预训练数据的水印添加及检测办法,构筑名称识别符库和稀有单词集库;随机从名称识别符库中选取水印的识别符,与从稀有单词集库中选取的若干个稀有单词结合,构筑成识别符‑特征符样式的备选词库,并将备选词填入预设的模板中;使用水印插入算法将构筑的水印随机插入个人文本中。构筑无效水印组成的空分布;对于单一待验证模型,利用空分布使用假设检验的方法得到真实水印被学习的置信度,置信度高于设定阈值,认定该待模型在预训练阶段或微调阶段使用了添加有水印的文本作为训练数据集。本发明实现在不同训练场景或使用场景下,准确、高效地验证个人文本被模型训练或滥用的情况,同时保证水印的鲁棒性与隐蔽性。
技术关键词
大语言模型
验证方法
文本
水印检测
令牌
数据
语句
阶段
计算机设备
检测办法
格式模板
可读存储介质
训练场景
统计特征
处理器
算法
样式
存储器
系统为您推荐了相关专利信息
结构语义融合
自动化构建方法
语义图谱
工作流框架
上下文语境信息