摘要
本发明提供一种面向“信息疫情”不实信息甄别的三分类混合迁移学习方法及系统,涉及信息管理技术领域,包括:使用融合后的数据,并根据常规的“虚假”或“真实”标签,进行二分类训练,以构建预训练模型;在微调模型中,通过“未确定”类别用于分类无法明确判定为“虚假”或“真实”的记录;利用预训练模型的BERT层生成的融合“信息疫情”关键词和常规不实信息的文本输出;结合BERT模型、TextCNN模型和fastText模型,对BERT模型的输入特征进行处理,利用微调模型对处理后的特征进行训练,将“信息疫情”相关的数据细分为“未确定”、“虚假”或“真实”三类。本发明可以更精准地甄别“信息疫情”中的不实信息,增加方法的实际应用效果。
技术关键词
BERT模型
迁移学习系统
预训练模型
关键词
迁移学习方法
数据
信息管理技术
分词
术语
可读存储介质
中文文本
标签
处理器
拼接方式
矩阵
程序
序列
存储装置
计算机
系统为您推荐了相关专利信息
文本实体识别
序列
模型构建方法
标签
训练样本数据
智能客服系统
数据包特征
文本
信息采集模块
识别模块