摘要
本发明提供一种面向电商智能客服大模型的攻击防御方法及装置,涉及人工智能安全技术领域,所述方法包括:步骤1,实时监控用户与智能客服的交互数据流,识别异常交互行为,当检测到异常行为时,激活多层防御策略;步骤2,基于多层防御策略,通过动态更新的多领域敏感词检测规则库和特殊符号匹配规则集,识别并处理输入文本中的敏感词、特殊字符序列及潜在注入标记,生成初步过滤的文本。本发明有效抵御针对电商智能客服大模型的各类恶意攻击,维护用户信息安全并提升客户服务质量与电商运营可靠性。
技术关键词
智能客服
文本
攻击防御方法
语义意图
电商
风险
自然语言理解
动态更新
情感倾向分析
规则集
标记
策略
攻击防御装置
语法结构
逻辑
标识符
核心
安全控制模块