摘要
本公开提供了一种图像信息识别方法及装置。该方法包括:获取单据图像;对单据图像进行光学字符识别,得到结构化文本信息;通过多模态信息识别大模型预测得到单据图像对应的多模态识别信息;确定结构化文本信息与多模态识别信息的相似度,在相似度满足信息相似度验证条件的情况下,基于单据图像对应的结构化文本信息与单据图像对应的多模态识别信息确定目标图像信息。上述技术方案,通过将光学字符识别与大模型预测的两种识别结果融合,提升了图像识别结果的准确度,并通过相似度验证增加了识别过程的冗余性,即使其中一个识别方法出现错误,也能通过另一个识别方法进行验证,从而提高了识别结果的可靠性。
技术关键词
单据
文本
多模态信息
光学字符识别
图像信息识别方法
布局
视觉
图像增强
信息识别装置
凭证
命名实体识别
语义
关系
图像获取模块
自然语言
识别模块
系统为您推荐了相关专利信息
心理健康评估方法
机器人聊天
数据
强度
心理健康评估系统
风险预测装置
风险预测模型
融合特征
多模态特征
多标签