一种大模型越狱攻击检测方法

AITNT
正文
推荐专利
一种大模型越狱攻击检测方法
申请号:CN202411965796
申请日期:2024-12-30
公开号:CN119377802B
公开日期:2025-03-25
类型:发明专利
摘要
本申请涉及一种大模型越狱攻击检测方法,该方法包括:S1:基于混合专家模型和Transformer架构构建越狱攻击检测模型,越狱攻击检测模型包括多层MoE‑Transformer结构,并采用正无标记学习方法训练越狱攻击检测模型;S2:获取输入的文本数据,并将文本数据转换为向量表示;S3:将向量表示输入至训练好的越狱攻击检测模型,经过多层MoE‑Transformer结构,输出高层特征向量;S4:高层特征向量经过全连接层,输出越狱攻击概率;基于越狱攻击概率确定越狱攻击情况。该方法在越狱攻击检测的准确性和效率上有显著提升,通过自动化的检测,确保了对大模型越狱攻击的实时防御,降低了潜在的安全风险。
技术关键词
攻击检测模型 攻击检测方法 前馈神经网络 学习方法 文本 样本 焦点 标记 数据 参数 注意力机制 表达式 优化器 警报 批量 元素 序列 动态
系统为您推荐了相关专利信息
1
一种SRT文件到FCPXML文件的转换方法
字幕 文本 格式转换方法 开创性 软件
2
基于多模态技术的人工智能交互与决策分析系统
人工智能交互 决策分析系统 多模态技术 特征提取单元 分析模块
3
一种智慧畜牧养殖溯源方法及系统
牲畜 溯源信息 深度学习分析 服务注册中心 物联网设备
4
一种基于大模型的视频融合方法及系统
视频融合方法 视觉特征 遮挡关系 画面 关键帧
5
基于大语言模型的增强问答方法和电子设备
大语言模型 分块 问答方法 文本 电子设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号