一种基于弱监督的噪声数据训练方法

正文

推荐专利

一种基于弱监督的噪声数据训练方法

申请号：CN202411462992

申请日期：2024-10-18

公开号：CN119691442A

公开日期：2025-03-25

类型：发明专利

摘要

本发明为一种基于弱监督的噪声数据训练方法，所述方法包括如下步骤：1）基于带噪声数据训练预测模型；2）使用预测模型生成伪标签；3）利用外部知识库对伪标签进行基于冲突识别的校验和修正；4)利用伪标签对权重更新模型进行训练；5)使用权重更新模型的权重对预测模型的权重进行更新；6)模型评估与优化。本发明可以很好地提高文本挖掘在实际应用中的可行性和有效性。这种方法利用现有的少量标注数据和机器学习算法，优化从噪声数据中学习的过程，减少对大量高质量标注数据的依赖，从而在保持高效数据处理的同时，提高信息提取的准确率。

技术关键词

噪声数据标签训练预测模型高效数据处理少量标注数据样本可视化工具机器学习算法实体展示模型融合策略文本同义词鲁棒性训练集参数偏差

系统为您推荐了相关专利信息

一种基于双重注意力和多尺度融合的宫颈图像处理方法

宫颈图像处理方法图像分割模型宫颈癌前病变注意力融合特征

一种知识检索处理方法及计算机设备

查询意图术语计算机设备关键词问答模型

一种非结构化数据建模方法及系统

主题文本数据建模方法词语 LDA模型

支付方法、装置、设备以及计算机程序产品

摄像设备支付方法消息验证码支付平台计算机程序产品

一种面向开放式外科手术的最佳镜头智能预测方法及系统

开放式外科手术智能预测方法深度卷积神经网络多头注意力机制语义特征

一种基于弱监督的噪声数据训练方法

站点导航

APP 下载