摘要
本发明涉及大模型应用技术领域,提供一种基于大模型的智能问答防护方法及装置,该方法包括:将用户输入文本和安全提示词融合,得到融合提示词,所述安全提示词为描述安全规则库中定义的安全规则的描述文本;将所述融合提示词输入问答模型,得到所述问答模型输出的文本内容,其中,所述问答模型是基于具有对抗性样本的训练集经过对抗性训练得到的,所述对抗性样本为包含样本有害信息以及样本安全提示词的样本文本。本发明有效避免了问答模型被用户诱导输出包含有害信息的内容,实现了对大模型问答的输出内容的有效防护。
技术关键词
问答模型
防护方法
文本
对抗性
关键词
样本
风险
实体
训练集
白名单
定义
处理器
防护装置
存储器
策略
模板
电子设备
模块
系统为您推荐了相关专利信息
特高压隔离开关
图像特征向量
更新模型参数
开关运行状态
场景
分析模型构建方法
机器学习算法
大数据
数据平台
主题关键词
编程控制方法
人工智能模型
人工智能辅助
参数
光标