一种基于检索增强的大语言模型生成内容检测方法

正文

推荐专利

申请号：CN202411807499

申请日期：2024-12-10

公开号：CN119782499B

公开日期：2025-10-28

类型：发明专利

摘要

本公开提供一种基于检索增强的大语言模型生成内容检测方法。包括三个部分：第一部分为语料库的构建与缓存，在离线阶段构造人类撰写语料库与大模型改写语料库；将人类撰写文本的标签设置为y＝0，大语言模型生成文本的标签设置为y＝1；第二部分为检索相关文本与改写文本并分别作为待检测文本的前缀；第三部分为通过检测方法计算在不同上下文条件下的待检测文本的生成概率差异，并与待检测文本的对数似然检测特征结合最终得到文本是否为大语言模型生成的判断结论。

技术关键词

文本内容检测方法大语言模型人类维基百科标签检测器离线阶段在线定义框架关系

系统为您推荐了相关专利信息

一种科研成果数据分析方法、系统、设备及介质

科研医院数据分析方法项目申报信息文本

一种基于语义拓扑与消歧冗余修剪的检索增强仓库级代码补全方法

代码补全方法标识符语义冗余分层特征

一种驾驶数据标注方法、模型训练方法、程序产品及设备

运动特征车辆状态估计模型训练方法车辆运动状态视频

一种基于大语言模型的事件关联分析方法及系统

大语言模型事件关联分析方法生成事件关系事件触发词

一种基于电子信息的智能自适应互动教学系统

互动教学系统 BERT模型数据处理模块系统管理模块教学用户

一种基于检索增强的大语言模型生成内容检测方法

站点导航

APP 下载