摘要
本申请公开了一种内容违规检测方法、装置、设备及存储介质,涉及人工智能技术领域,包括:处理法律法规文本、历史违规案例与历史举报案例,基于得到的各问答对建立安全规则库;利用安全规则库训练初始内容识别模型得到待评估内容识别模型,模拟攻击待评估内容识别模型得到符合预设高风险判定条件的目标样本,利用多目标奖励函数、基于MCTS的对抗验证机制与目标样本构建目标评估模型;利用目标评估模型评估基于待评估内容识别模型识别预设内容得到的第一识别结果,利用安全策略梯度算法并基于评估结果调整待评估内容识别模型,利用目标内容识别模型识别目标内容,基于第二识别结果判断目标内容是否违规。这样能够提高识别内容的效率。
技术关键词
违规检测方法
验证机制
梯度算法
文本
高风险
样本
解析工具
行业知识图谱
特征描述信息
意图类别
离线历史数据
场景类别
自然语言解析
强化学习技术
强化学习框架
语义特征
实体
合规性
语义场景
系统为您推荐了相关专利信息
BERT模型
文本分类方法
金融
样本
训练分类模型
知识问答方法
缓存策略
语义检索技术
计算机执行指令
检索策略