摘要
本发明适用于虚假新闻检测技术领域,提供了一种面向不平衡样本的假新闻检测方法,包括以下步骤:单词嵌入;使用RoBERTa模型进行单词的嵌入,RoBERTa包括三种嵌入编码,分别是标记嵌入、分割嵌入和位置嵌入;语义交互模块;由RoBERTa嵌入编码、Transformer编码器和Bi‑GRU组成,用于提取全局特征;门控机制模块;由ConvID、BatchNorm、CGU、sigmoid激活函数和Dropout层组成,用于提取局部特征;权重重采样模块;设置权重和采样倍率。本发明针对数据集不平衡现象提出了权重重采样方法,不仅能够同时捕获全局特征和局部特征,还提高了分类的准确率。
技术关键词
假新闻检测方法
编码器
序列
新闻检测技术
样本
多头注意力机制
采样模块
训练语言模型
标志位
模块单元
采样方法
标记
非线性
语义特征
文章
文本
系统为您推荐了相关专利信息
面向电力巡检
电力巡检图像
卷积神经网络模型
图像识别方法
融合特征
条件随机场模型
BRDF模型
区域图像识别
编码器
干燥塔
建筑识别方法
图像分割模型
通道注意力机制
数字正射影像
遥感影像数据
故障检测模型
中央空调系统
空气流量传感器
静压传感器
数据获取单元
光学遥感影像
编码解码器
注意力
全景分割方法
分支