摘要
本发明公开了基于轻量级改写转换的生成文本检测方法、系统及介质,通过正向改写模型对待检测文本进行去AI化转换,将待检测文本与所生成的类人等效文本融合后输入到分类器,从而输出分类结果;所述正向改写模型的训练过程如下:利用人工撰写文本和机器生成文本构建配对样本集,通过最小化交叉熵损失微调正向改写模型,所述机器生成文本为通过大语言模型逆向为通过至少一种大语言模型生成并过滤冗余样本后所得到的文本;该生成文本检测方法、系统及介质完全无需访问任何外部、闭源或专有的大语言模型API,不仅降低了成本和延迟,也极大地简化了系统架构和部署流程,解决了水印技术和相似性再生方法受限于闭源模型、难以实际部署的问题。
技术关键词
文本检测方法
大语言模型
分类器训练
分类程序
样本
生成标签
人类
风格
掩码技术
训练分类器
水印技术
再生方法
冗余
计算机系统
处理器
介质
存储器
系统为您推荐了相关专利信息
BP神经网络模型
环境温度信息
预测颗粒物浓度
颗粒传感器
样本
环境反向散射系统
量子态
通信误码率
样本
特征提取模型