摘要
本发明涉及语义标签生成领域,且公开了一种基于半监督学习的语义标签生成方法,包括收集具有标签的有监督数据和无标签的未标注数据,从原始数据中提取出语义标签生成的特征;利用标注数据训练一个监督学习模型,使用训练好的模型对无标签数据进行预测,生成初步的标签;将模型生成的初步标签作为伪标签,添加到未标注数据中,使用已标注数据和带有伪标签的未标注数据联合训练模型;在每一轮迭代中,将已标注数据和带有高置信度伪标签的未标注数据一起训练,使用高置信度的标签进行标签更新,剔除低置信度的伪标签;通过训练完成的半监督学习模型对所有数据进行预测,生成最终的语义标签。本发明具备提高标签生成的准确性的优点。
技术关键词
语义标签生成方法
半监督学习
监督学习模型
数据特征提取
置信度阈值
训练集
无标签样本
生成标签
特征选择
插值法
超参数
文本
音频
算法
动态
系统为您推荐了相关专利信息
葡萄霜霉病
注意力
程度检测方法
多尺度特征
上采样
隶属度函数
船舶
DWA算法
门控循环神经网络
避碰规则
近海钢结构
损伤预测方法
多模态
人工智能交叉技术
结构健康监测