摘要
一种基于区块链的大语言模型攻击检测方法。其包括构建大语言模型提示攻击防御系统;用户将查询对发送给大语言模型;大语言模型响应并生成输出内容;生成交互信息对;将交互信息上传区块链;检测器进行检测,生成检测结果并存储到区块链;根据检测结果判断是否需要对用户进行处罚等步骤。本发明利用区块链的不可篡改性质,用户查询和大语言模型响应都永久记录在区块链上,提供一个可靠审计追踪机制。所有关键交互信息和检测器检测结果都公开记录在区块链上,为用户提供一个清晰责任和行为记录。检测查询内容同时进行用户行为检测,查看用户是否存在异常查询。用户和大语言模型交互在链下进行,只有关键信息记录在区块链上,降低了成本。
技术关键词
攻击检测方法
大语言模型
检测器
攻击防御系统
生成交互信息
加密算法
解密
个人隐私数据
处罚方法
模式识别
关键词
合规性
密钥
机制
协议
信誉
模块
自然语言
系统为您推荐了相关专利信息
大语言模型
命名实体识别技术
构建查询语句
主题
交叉注意力机制
图像生成模型
大语言模型
进化方法
进化算法
网络架构