摘要
本发明公开了一种基于多轮对话跨轮次语义关联的后门指纹嵌入方法和装置,属于人工智能安全技术领域,方法包括:基于不同的跨轮次语义关联构建多轮对话分别得到后门触发数据集和后门抑制数据集,并与正常对话数据集共同构建为训练数据集;利用训练数据集对基础模型进行训练得到指纹模型;从后门触发数据集、后门抑制数据集以及正常对话数据集中分别采样构造拟合数据集,并引入符合后门触发、后门抑制和正常对话三种分布的新样本构造泛化数据集,共同构建为验权数据集;利用验权数据集对指纹模型进行验证。本发明能够提高指纹嵌入的泛化性、鲁棒性和隐蔽性,对于保护和解决大模型知识产权侵权和剽窃等相关安全性的问题具有重要应用价值。
技术关键词
多轮对话
后门
指纹嵌入方法
指纹模型
语义
数据
样本
指纹验证
风格
主题
存储计算机程序
模块
有效性
指标
关系
基础
存储器
逻辑
鲁棒性
系统为您推荐了相关专利信息
多尺度特征提取
边缘检测算子
编解码结构
无人机航拍影像
铁轨
数字孪生模型
动态仿真方法
语义框架
机器学习算法
建筑能效管理
视频序列分割方法
融合特征
融合专家
多尺度局部特征
矩阵