摘要
本公开提供一种基于检索增强的大语言模型生成内容检测方法。包括三个部分:第一部分为语料库的构建与缓存,在离线阶段构造人类撰写语料库与大模型改写语料库;将人类撰写文本的标签设置为y=0,大语言模型生成文本的标签设置为y=1;第二部分为检索相关文本与改写文本并分别作为待检测文本的前缀;第三部分为通过检测方法计算在不同上下文条件下的待检测文本的生成概率差异,并与待检测文本的对数似然检测特征结合最终得到文本是否为大语言模型生成的判断结论。
技术关键词
文本
内容检测方法
大语言模型
人类
维基百科
标签
检测器
离线
阶段
在线
定义
框架
关系
系统为您推荐了相关专利信息
运动特征
车辆状态估计
模型训练方法
车辆运动状态
视频
大语言模型
事件关联分析方法
生成事件
关系
事件触发词
互动教学系统
BERT模型
数据处理模块
系统管理模块
教学用户