摘要
本说明书实施例公开了一种生成式内容风险预测方法、装置、存储介质及电子设备,首先获取风险问题文本,然后将风险问题文本输入大语言模型中进行内容生成,并提取大语言模型的中间网络层级在内容生成过程中的内部表示,最后基于内部表示,利用目标分类器确定大语言模型在内容生成过程中输出风险内容的概率。通过提前预测风险内容的生成,及时进行风险管控,可以避免将风险暴露给用户,提升用户使用体验。
技术关键词
大语言模型
风险预测方法
分类器
层级
文本
风险预测装置
电子设备
新词
计算机程序产品
处理器
非线性
序列
网络结构
样本
数据
存储器
标签
编码