摘要
本发明实施例中提供了一种集成学习的AI生成新闻鉴别方法,属于数据处理技术领域,具体包括:将样本新闻文本集输入随机森林模块分别进行TF‑IDF向量化、BERT向量化和附加特征提取;将提取后的特征向量进行拼接;利用拼接特征向量训练随机森林模块;将待检测新闻文本输入训练好的随机森林模块,得到第一概率值;将待检测新闻文本输入基于首段续写的文本一致性模块,计算第一平均相似度和第一平均对数概率比;将待检测新闻文本输入基于中心句重写的文本一致性验证模块,计算第二平均相似度和第二平均对数概率比;进行加权求和,得到综合评分并据此生成待检测新闻文本的鉴别结果。通过本发明的方案,提高了识别效率、精准度和适应性。
技术关键词
文本
大语言模型
鉴别方法
表达式
交叉验证方法
模块
样本
代表
BERT模型
随机森林模型
数据处理技术
参数
网格
策略
标签
频率
系统为您推荐了相关专利信息
冷启动方法
客户端
商品属性信息
语义向量空间
大语言模型
规模
反演方法
反演模型
多尺度特征
卫星观测数据
历史收入数据
序列
DTW算法
收入预估系统
日期