一种视觉信息抽取方法、装置、计算机设备和介质

正文

推荐专利

申请号：CN202510243908

申请日期：2025-03-03

公开号：CN120234625A

公开日期：2025-07-01

类型：发明专利

摘要

本申请涉及人工智能技术领域，公开了一种视觉信息抽取方法、装置、计算机设备和介质，首先获取问题文本数据和目标图片中的内容文本数据；其次基于目标图片、问题文本数据、内容文本数据输入进行图文匹配，生成问题文本数据对应的待检查答案；并利用待检查答案、目标图片和问题文本数据进行逻辑验证，得到问题文本数据对应的候选答案；最后根据内容文本数据和问题文本数据对候选答案进行信息矫正，得到指定内容项对应的目标内容数据。相较于仅依赖目标图片和问题文本数据的方法，能够生成更准确的待检查答案；进一步地，利用逻辑验证，显著提升了候选答案的准确性；最终，通过信息矫正，得到更准确的目标内容数据，生成更准确的答案文本数据。

技术关键词

答案文本图片多模态信息抽取方法内容项光学字符识别样本图文矫正大语言模型计算机设备视觉逻辑可读存储介质人工智能技术数据获取模块抽取装置

系统为您推荐了相关专利信息

实体识别方法、装置、设备及存储介质

实体识别模型实体知识库文本实体识别方法字符

一种电网事件主动安全应对策略增强生成方法与系统

生成方法策略摘要采集管理方法电力系统网络安全技术

一种多模态光疗设备的智能协同控制方法及系统

光疗设备协同控制方法反馈特征多模态参数

相似接口推荐方法、装置、设备、存储介质及程序产品

接口分片推荐方法文本逻辑

数据处理模型的训练方法、数据处理方法和装置

数据处理模型文本训练装置数据处理方法论文

一种视觉信息抽取方法、装置、计算机设备和介质

站点导航

APP 下载