摘要
本发明公开了一种基于词元概率统计的大模型生成中文文本检测方法及系统。本发明首先调用代理大语言模型对目标文本进行推理,获取其每个token的对数概率,然后基于目标文本的token对数概率序列,分别计算全局统计量与局部统计量;最后将全局统计量与局部统计量相除作为目标文本的检测得分,将检测得分与给定的阈值相比较进而做出决策。本发明将目标文本的token对数概率序列的全局与局部统计量相结合,实现了低成本、高性能的大语言模型生成文本检测。相比于现有的仅利用了全局统计量的检测方法,本文在跨模型、跨领域等复杂场景下均实现了更高的检测精度。
技术关键词
中文文本
序列
算术平均值
调用代理模型
计算机电子设备
Softmax函数
滑动窗口
存储计算机程序
大语言模型
计算机程序产品
分词
处理器
存储器
高性能
低成本
模块
指令
决策
场景
系统为您推荐了相关专利信息
环境状态信息
卸载方法
网络
深度强化学习技术
服务器
动力电池充放电
管理优化方法
电池状态数据
深度学习模型
电压稳定
视觉注意力机制
评价方法
视觉特征提取
多任务联合训练
局部视觉特征
智能调控方法
火电
动态响应模型
光伏发电量
机组