一种基于多特征的机器生成自然语言检测方法

正文

推荐专利

申请号：CN202510226003

申请日期：2025-02-27

公开号：CN120067333A

公开日期：2025-05-30

类型：发明专利

摘要

本发明涉及自然语言处理技术领域，提出一种基于多特征的机器生成自然语言检测方法，包括获取待检测文本，并对待检测文本进行预处理，得到预处理文本；将预处理文本输入预训练语言模型的分词器进行文本分词并将分词转换为预训练语言模型可识别的词元序列，将词元序列输入预训练语言模型中进行运算，获取每个词元的未归一化预测概率；根据词元序列和每个词元的未归一化预测概率计算文本的11种特征；将11种特征拼合成一个11维向量，并输入到机器学习分类算法中进行监督学习，得到机器生成自然语言检测器；将待检测的文本输入机器生成自然语言检测器中，得到检测结果。本发明检测速度快、检测准确度稿且检测方法的可信度与透明度高。

技术关键词

生成自然语言文本预训练语言模型机器学习分类算法弱分类器信息熵检测器分词梯度提升树序列机器学习算法样本密度透明度逻辑参数人类速度

系统为您推荐了相关专利信息

端到端的影像文件处理方法、模型构建方法及装置

时空注意力机制文本报告图像序列

一种基于内容分享平台的种草营销策略博主推荐方法

整数规划模型内容分享平台娱乐特征互动特征情绪特征

基于大语言模型的机房空调节能方法、装置、设备及存储介质

空调控制策略环境状态信息大语言模型文本机房空调控制

一种基于大语言模型的文档噪声处理方法、装置、设备及存储介质

大语言模型检索算法队列陷阱二分类模型

一种公路工程环境下的近场通信优化方法

通信优化方法音频接收端发送端近场通信设备

一种基于多特征的机器生成自然语言检测方法

站点导航

APP 下载