图像信息识别方法及装置

AITNT
正文
推荐专利
图像信息识别方法及装置
申请号:CN202510666429
申请日期:2025-05-22
公开号:CN120564204A
公开日期:2025-08-29
类型:发明专利
摘要
本公开提供了一种图像信息识别方法及装置。该方法包括:获取单据图像;对单据图像进行光学字符识别,得到结构化文本信息;通过多模态信息识别大模型预测得到单据图像对应的多模态识别信息;确定结构化文本信息与多模态识别信息的相似度,在相似度满足信息相似度验证条件的情况下,基于单据图像对应的结构化文本信息与单据图像对应的多模态识别信息确定目标图像信息。上述技术方案,通过将光学字符识别与大模型预测的两种识别结果融合,提升了图像识别结果的准确度,并通过相似度验证增加了识别过程的冗余性,即使其中一个识别方法出现错误,也能通过另一个识别方法进行验证,从而提高了识别结果的可靠性。
技术关键词
单据 文本 多模态信息 光学字符识别 图像信息识别方法 布局 视觉 图像增强 信息识别装置 凭证 命名实体识别 语义 关系 图像获取模块 自然语言 识别模块
系统为您推荐了相关专利信息
1
基于低秩适应的大模型持续学习方法、装置、设备及介质
持续学习方法 大语言模型 矩阵 文本 基础
2
一种基于机器陪聊服务的用户心理健康评估方法、系统、介质及处理器
心理健康评估方法 机器人聊天 数据 强度 心理健康评估系统
3
用于经济大数据中文本数据的泛化处理保护方法
保护方法 文本 大数据 节点 森林模型
4
基于多模态和图神经网络的多标签慢性病风险预测装置
风险预测装置 风险预测模型 融合特征 多模态特征 多标签
5
分子数据处理模型的训练方法、分子数据处理方法、装置、设备、存储介质及程序产品
数据处理模型 分子 语言理解模型 序列 标记器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号