摘要
基于注意力机制和最优传输相结合的伪标签生成方法及设备,它属于机器学习和深度学习领域。本发明解决了传统方法生成伪标签的效率低、准确性差的问题。本发明设计了样本层面的注意力网络用于建模文本数据样本的局部语义关系,并将其融入到基于最优传输机制的伪标签生成模块中。通过在最优传输框架中加入注意力机制,模型可以在计算样本分配时综合考虑全局的结构信息和局部的语义信息,使得相似文本数据样本在伪标签分配时具有更高的关联性,从而提高伪标签的质量和稳定性,保证生成的伪标签准确性的同时,相比于现有方法,本发明方法还提高了伪标签生成的效率。本发明方法可以应用于文本数据的伪标签生成。
技术关键词
数据样本集合
标签生成方法
注意力机制
投影神经网络
特征提取器
矩阵
文本数据类别
标签生成设备
元素
计算方法
语义
超参数
模块
存储器