一种文本识别的方法、模型训练方法、设备及存储介质

正文

推荐专利

申请号：CN202510341576

申请日期：2025-03-21

公开号：CN120260054A

公开日期：2025-07-04

类型：发明专利

摘要

本申请公开一种文本识别的方法、模型训练方法、设备及存储介质，涉及光学字符识别技术领域，该方法包括：获取样本图像以及对应的标签文本框信息和标签文本信息；将样本图像输入到单视觉模型和残差网络模型，得到第一样本文本框信息和第一样本文本信息；将样本图像和处理要求输入到多模态AI大模型，得到第二样本文本框信息和第二样本文本信息；根据标签文本框信息、第一样本文本框信息、第二样本文本框信息、标签文本信息、第一样本文本信息和第二样本文本信息，确定蒸馏损失值，从而对文本识别模型的参数进行更新；将待识别图像输入到文本识别模型，得到文本识别结果。该方法能够提高文本识别的泛化能力，扩大文本识别的应用场景。

技术关键词

样本标签文本残差网络模型文本识别模型模型训练方法图像融合特征注意力机制光学字符识别技术蒸馏可读存储介质存储计算机程序计算机视觉多模态模块存储器

系统为您推荐了相关专利信息

一种基于多源数据的知识图谱构建方法及装置

实体知识图谱构建方法关系训练样本数据文本

一种基于多模态信息的任务执行方法及系统

多模态信息变换器编码器多任务样本

术后深静脉血栓预测模型建立方法、装置、设备及介质

深静脉血栓预测模型建立方法多尺度特征融合训练神经网络模型预测模型建立装置

基于两阶段图神经网络的fMRI数据分析模型构建方法、装置

节点特征脑网络特征数据分析模型两阶段表型特征

图像编码方法、设备、存储介质及程序产品

图像编码方法令牌大语言模型文本映射技术

一种文本识别的方法、模型训练方法、设备及存储介质

站点导航

APP 下载