摘要
本发明提供了一种基于分类大模型的长文本内容安全风险判定方法。该方法包括:按照一定规则把长文本拆分成多个短文本;设置不同类型风险所对应的风险权重,设置不同场景对应的风险阈值;使用预训练好的风险识别模型对每个短文本进行分析,判断每个短文本是否存在潜在风险;根据存在风险的短文本的数量以及短文本对应的风险权重计算出所述长文本的综合风险值,根据所述长文本的综合风险值和所述长文本对应的场景对应的风险阈值判断所述长文本是否存在安全风险。本发明实施例可以解决分类模型识别长文本准确率低的问题。可以针对不同的场景输出不同的结果,提高长文本风险识别的准确性。
技术关键词
风险识别模型
风险判定方法
场景
拆分规则
分类模型识别
文本分类模型
浮点数
样本
广告
分类器
数值
参数
代表
数据