摘要
本发明涉及人工智能和自然语言处理的技术领域,具体涉及基于片段语义交叉组合的提示干扰构造与优化方法及装置。所述方法包括:基于段落级提示片段和句子级提示片段构建候选提示组合,并基于与原始提示文本的语义一致性筛选初始有效提示组合,将其与攻击目标指令拼接形成风险提示,通过语言模型获取风险提示对应的风险响应和有害性评分,以计算初始Δ‑TRDS分数;对初始有效提示组合中的所有片段依次进行中立内容替换操作,并计算替换后的目标有效提示组合对应的目标Δ‑TRDS分数;根据替换前后Δ‑TRDS分数的差值确定初始有效提示组合中的提示干扰片段。本发明解决了传统手工构造提示的方法缺乏系统性和可扩展性的问题。
技术关键词
语义
风险
文本
机器可读存储介质
存储器存储指令
基准
鲁棒性
电子设备
自然语言
处理器
模块
手工
接口
系统为您推荐了相关专利信息
多模态特征融合
检测设备
神经网络模型
非易失性存储介质
云网
编程
答题
知识点标签
推荐方法
sigmoid函数
变电站设备运维
设备监测数据
三元组
运维策略
设备特征