基于输出响应的智能体助手攻击防御方法及相关装置

正文

推荐专利

申请号：CN202510491840

申请日期：2025-04-18

公开号：CN120165967B

公开日期：2025-12-26

类型：发明专利

摘要

本发明属于人工智能领域，公开了一种基于输出响应的智能体助手攻击防御方法及相关装置，包括获取智能体助手基于当前感知界面和当前操作的当前输出响应；进行当前输出响应的对抗性检测，得到状态安全性检测结果；基于当前输出响应构建当前状态节点并插入至状态树中，以及从状态树中获取第一路径信息和第二路径信息；对第一路径信息进行越狱性判定，得到路径安全性检测结果；对第二路径信息进行任务完成可能度判定，得到路径完整性检测结果；当状态安全性检测结果、路径安全性检测结果和路径完整性检测结果均为通过时，智能体助手继续执行；否则，回滚至状态树中设定状态节点对应的状态。增强智能体助手的稳健性和适应性，保障智能体助手安全应用。

技术关键词

安全性检测攻击防御方法大语言模型节点对抗性攻击防御系统指令保障智能可读存储介质数据获取模块处理器样本界面计算机设备文本存储器日志队列

系统为您推荐了相关专利信息

无人化塔机的路径规划方法及系统

路径规划方法支臂定义路径规划系统网格地图

一种多节点冷板并联液冷管网数字孪生模型构建方法

数字孪生模型液冷冷板回液机器学习算法多节点

一种AS网络拓扑中关键地形的识别方法

网络拓扑节点识别方法桥接系数核心

一种基于虚拟数字人的教学交互系统及交互方法

教学交互系统信息处理模块学生分析模块生物识别技术

基于布尔网络模型的HIV基因调控网络构建方法及其应用

基因节点多项式网络聚类分析方法

基于输出响应的智能体助手攻击防御方法及相关装置

站点导航

APP 下载