摘要
本发明公开了一种基于多时间步损失序列的标签噪声检测方法,利用文字识别模块,从输入图像识别文字;利用MSL‑MentorNet标签噪声检测模块,根据文字识别结果,分析输入图像在连续训练周期中的损失序列,动态分配样本权重以检测并过滤噪声标签,并将筛选后的数据反馈至文字识别模块优化模型训练。本发明采用MSL‑MentorNet标签噪声检测和基于动态课程学习的噪声过滤机制,通过分析样本在连续训练周期中的损失序列,利用BiLSTM网络区分噪声标签与干净难样本,结合线性调度策略逐步增加训练数据量。基于本发明的方法,可提高复杂文本图像识别精度,尤其适用于古籍数字化、历史文献修复、工业OCR质检等场景中复杂文本图像的鲁棒识别与噪声过滤。
技术关键词
文字识别方法
噪声检测模块
噪声标签
薄板样条
噪声检测方法
序列
样本
噪声数据
识别模块
注意力解码
周期
文本图像识别
优化训练数据
视觉特征提取
更新网络参数
动态课程
训练数据量
系统为您推荐了相关专利信息
轮廓度检测方法
迭代优化算法
数据管理模块
精锻叶片
噪声抑制
图像生成模型
噪声预测器
文本编码器
样本
语义特征
超声无损检测方法
钢管内混凝土
可视化软件
超声检测仪
软磁条
大语言模型
交互式教学方法
交互式教学系统
多模态
文字识别方法
空间插值方法
XGBoost算法
训练机器学习模型
气象站
XGBoost模型