一种基于半监督学习的语义标签生成方法

AITNT
正文
推荐专利
一种基于半监督学习的语义标签生成方法
申请号:CN202510157833
申请日期:2025-02-13
公开号:CN120086593A
公开日期:2025-06-03
类型:发明专利
摘要
本发明涉及语义标签生成领域,且公开了一种基于半监督学习的语义标签生成方法,包括收集具有标签的有监督数据和无标签的未标注数据,从原始数据中提取出语义标签生成的特征;利用标注数据训练一个监督学习模型,使用训练好的模型对无标签数据进行预测,生成初步的标签;将模型生成的初步标签作为伪标签,添加到未标注数据中,使用已标注数据和带有伪标签的未标注数据联合训练模型;在每一轮迭代中,将已标注数据和带有高置信度伪标签的未标注数据一起训练,使用高置信度的标签进行标签更新,剔除低置信度的伪标签;通过训练完成的半监督学习模型对所有数据进行预测,生成最终的语义标签。本发明具备提高标签生成的准确性的优点。
技术关键词
语义标签生成方法 半监督学习 监督学习模型 数据特征提取 置信度阈值 训练集 无标签样本 生成标签 特征选择 插值法 超参数 文本 音频 算法 动态
系统为您推荐了相关专利信息
1
一种葡萄霜霉病叶片病害严重程度检测方法、系统
葡萄霜霉病 注意力 程度检测方法 多尺度特征 上采样
2
一种障碍船运动信息不定条件下的船舶避碰优化方法
隶属度函数 船舶 DWA算法 门控循环神经网络 避碰规则
3
基于混合RAG-多模态的近海钢结构损伤预测方法
近海钢结构 损伤预测方法 多模态 人工智能交叉技术 结构健康监测
4
一种利用噪声转移进行代码漏洞修复检测的方法
转移概率矩阵 漏洞 数据 置信度阈值 特征提取器
5
一种推理方法、装置、设备、可读存储介质及程序产品
大语言模型 推理方法 模板 多语言 置信度阈值
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号