摘要
本发明提出了基于直接差异学习的机器生成文本检测方法及系统,涉及人工智能安全技术领域。包括使用大语言模型对人类文本进行重生成或润色、重写,构建机器生成文本数据,进而得到人类书写文本和机器生成文本数据对;基于构建的数据对,采用直接差异学习对评分模型进行优化,优化目标为最大化机器生成文本的条件概率差异,同时最小化人类文本的条件概率差异;获取待检测文本,使用优化后的评分模型计算待检测文本的条件概率差异;基于条件概率差异,采用参考聚类方法估算出待检测文本属于机器生成文本的概率。本发明提出的直接差异学习显式地建模了机器生成文本检测的任务目标,在检测鲁棒性、跨域泛化能力和计算效率方面具有显著优势。
技术关键词
文本检测方法
聚类方法
人类
大语言模型
统计机器
数据获取模块
处理器
程序
邻域
超参数
可读存储介质
存储器
鲁棒性
样本
代表
电子设备
系统为您推荐了相关专利信息
三维剂量预测方法
节点特征
神经网络模型
剂量预测系统
计划
基因表达数据
推断方法
构建基因调控网络
学习器
融合特征