一种基于样本贡献感知的低资源语言图文识别方法、电子设备及计算机可读储存介质

AITNT
正文
推荐专利
一种基于样本贡献感知的低资源语言图文识别方法、电子设备及计算机可读储存介质
申请号:CN202510104489
申请日期:2025-01-23
公开号:CN119942563B
公开日期:2025-10-24
类型:发明专利
摘要
本发明涉及一种基于样本贡献感知的低资源语言图文识别方法、电子设备及计算机可读储存介质,属于模型训练技术领域,通过获取待识别的低资源语言文本图像集合,并对其中少量的文本图像进行标注;使用带标注的文本图像集合训练文本识别网络;使用多个迭代步骤逐批地从未标注样本中选择贡献度最高的样本组并进行标注;通过弹性权重整合算法使用新标注的样本组对文本识别网络进行增量学习训练,并继续执行迭代,直到标注成本达到限定值;利用训练好的文本图像识别网络对任意输入的文本图像进行识别,输出识别结果。本发明可以在训练集图像标注成本有限的情况下,提升低资源语言图文识别模型的识别准确率。
技术关键词
图文识别方法 样本 计算机可读储存介质 视觉特征 文本图像识别 文本识别 模型训练技术 低资源语言 解码模块 电子设备 可读存储介质 识别标签 处理器 网络节点 存储器
系统为您推荐了相关专利信息
1
网络信息安全保护方法、装置及系统
大语言模型 消息认证码 核对系统 字段 脚本
2
一种后处理一体机
移动通道 存储冰箱 转运机构 物料盘 支撑底座
3
一种样本分箱方法、计算机程序产品及设备
梯度直方图 样本 分箱方法 标签 节点
4
视频转换方法和装置
神经网络模型 视频转换方法 样本 格式 视频转换装置
5
一种用户登录行为的异常分析方法、装置和电子设备
集成学习模型 异常分析方法 聚类 指数 计算机程序指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号