摘要
本发明公开一种基于多源领域适应的文本情感分类方法、系统、设备及存储介质,其方法包括:获取未携带真实情感分类标签的目标域数据集以及携带真实情感分类标签的多个源域数据集;获取第一分类损失函数以及考虑到对齐各个源域和目标域的联合概率分布的总损失函数;利用目标域数据集、多个源域数据集和第一分类损失函数对文本情感分类模型进行预训练,随后输出每个目标文本序列对应的伪标签以更新目标域数据集;利用更新后的目标域数据集、多个源域数据集和总损失函数对预训练后的文本情感分类模型进行正式训练,随后输出每个目标文本序列对应的预测情感分类标签。本发明可以缩小各个源域与目标域之间的分布差异,提高模型在目标域中的泛化能力。
技术关键词
文本情感分类方法
文本情感分类模型
标签
序列
数据
相似性度量函数
上存储计算机程序
分类器
处理器
计算机设备
参数
可读存储介质
网络
模块
存储器
表达式
系统为您推荐了相关专利信息
分区优化方法
动态
发电机
历史运行数据
电力系统工程技术
动态误差补偿
数控机床系统
刀具
覆盖率
数据分析单元
智能推荐方法
数据
DBSCAN算法
互联网
自然语言
无人机管控系统
控制管理系统
管控平台
无人机集群
策略