摘要
本申请公开了一种模型训练方法、装置、电子设备和存储介质,方法包括:获取待处理图像,待处理图像中的文本数据按目标样式排列;对待处理图像进行聚类处理,得到聚类结果,聚类结果用于表示目标样式为新的样式;基于待处理图像以及待处理图像的光学字符识别OCR结果对待训练模型进行模型训练,得到图像识别模型,待训练模型包括依次连接的LayoutLMv3和CRF模型,LayoutLMv3用于基于待处理图像和OCR结果生成待处理图像对应的图文特征向量,CRF模型用于对图文特征向量进行处理得到文本数据的识别结果。这样,能够通过模型训练快速学习到新样式的特征,便于后续训练得到的模型进行图像识别,提高图像识别效果。
技术关键词
模型训练方法
图像识别模型
光学字符识别
聚类
CRF模型
模型训练系统
样式
文本
图文
条件随机场
注意力机制
数据
模型训练装置
模型训练模块
电子设备
图像获取模块
处理器
可读存储介质
词语