摘要
本申请公开了一种文本识别方法、装置、存储介质、程序产品及电子设备。涉及人工智能领域,该方法包括:获取目标文件,其中,目标文件中包括待进行文本识别的文本内容;通过目标识别模型对目标文件进行文本识别,得到文本识别结果,其中,目标识别模型为大语言模型,目标识别模型在单轮迭代中基于N个训练样本的样本识别结果和真实标签进行训练,单轮迭代中的N个训练样本为基于维诺图从M个训练样本中选择得到的,维诺图中的点位用于表示训练样本,点位的坐标基于训练样本的样本识别结果的语义向量确定,N小于M。通过本申请,解决了相关技术中对文本识别模型的训练效果差,导致训练好的文本识别模型的文本识别准确性低的问题。
技术关键词
文本识别方法
语义向量
样本
文本识别模型
单轮
中心线
文本识别装置
可读存储介质
标签
多边形
电子设备
计算机程序产品
坐标
节点
识别模块
处理器
系统为您推荐了相关专利信息
时间段
前馈神经网络
注意力机制
样本
计算机可执行指令
神经网络参数
粒子群优化算法
信号
数据
训练样本集
血液
鉴别方法
重采样方法
SVM算法
XGBoost算法