摘要
本发明公开了一种基于问答数据的大模型溯源方法及系统,涉及大模型溯源技术领域,包括,收集问答数据集,通过语义嵌入函数进行数据映射,并根据语义相似度筛选组成相似度集合,统计通用词汇的频率筛选组成关键词集合作为触发器词汇,基于问答对设置水印触发器,并筛选触发器问答对数量,区分携带水印触发器的问答对数据,针对目标语言模型,计算单词在上下文的生成概率,对训练数据中包含触发器的触发器词进行调整干预。本发明所述方法通过随机选取问答对附加触发器并构造训练数据集,避免了触发器的分布规律可能被恶意分析者察觉,进一步增强触发器的隐蔽性。
技术关键词
动态触发器
溯源方法
问答对数据
答案
语义
蒙特卡洛方法
生成报表
序列
验证时间戳
生成关键词
文本
频率
模型训练模块
生成水印
溯源技术
溯源系统
系统为您推荐了相关专利信息
装配尺寸链
产品装配方法
装配公差
蒙特卡罗模拟法
零件特征
大语言模型
清洗规则
数据清洗方法
数据清洗装置
数据清洗效率