摘要
本发明公开一种基于条件信息流最大化的大模型内容安全检测方法及系统,属于大模型安全技术领域。所述方法包括:利用预训练语言模型提取待检测内容文本的高阶隐向量表示;基于所述高阶隐向量表示,利用线性分类器获取待检测内容文本的安全检测结果;其中,所述预训练语言模型和所述线性分类器的网络参数的获取是通过条件信息流最大化优化目标来最大化输入‑表示信息流和表示‑任务信息流。本发明不仅可以提升预训练模型在大模型内容安全检测任务的泛化性能,也能增强对训练样本较少类别的有效判别能力,提供了模型在噪声场景下的鲁棒性。
技术关键词
预训练语言模型
线性分类器
最大化准则
文本
对抗性
参数
网络
标签
预训练模型
判别模块
编码模块
数据
鲁棒性
中间层
噪声
关系
样本
场景
系统为您推荐了相关专利信息
病理切片图像
图像编码
预训练模型
大语言模型
分析方法
文本
参数抽取方法
双向注意力机制
自然语言模型
焦点损失函数
语义分割模型
表格解析方法
图像
训练系统
解析系统
机器翻译方法
机器翻译装置
机器翻译技术
存储计算机程序
文本