图像文本特征对齐融合的信息抽取方法、设备及程序产品

正文

推荐专利

申请号：CN202411122940

申请日期：2024-08-15

公开号：CN119250189B

公开日期：2025-10-28

类型：发明专利

摘要

本发明提供一种图像文本特征对齐融合的信息抽取方法、设备及程序产品，方法包括：将目标图像输入图像特征提取模型得到图像特征；检测识别目标图像中的文本块，得到文本块识别结果；将文本块识别结果输入文本特征提取模型，得到文本特征；基于文本块识别结果构建文本块特征，将文本特征与图像特征桥接对齐；将文本特征和图像特征输入特征融合模型进行拼接，得到综合特征向量；特征融合模型包括自编码器和变压器编码器；将综合特征向量分类输入预设分类器，执行语义实体识别任务，确定文本块对应的分类结果，基于分类结果，执行关系抽取任务；能够解决在处理含有复杂背景和多元素的图像时，信息提取不准确的问题。

技术关键词

文本图像特征提取模型编码器信息抽取方法语义实体特征提取网络视觉特征特征金字塔网络答案变压器分类器语义特征指令索引样本残差学习计算机程序产品处理器

系统为您推荐了相关专利信息

一种集成存储、扩展坞与摄影辅助功能的智能设备

摄影辅助功能智能设备风道板接口模块控制模块

一种声调评估康复训练装置及系统

康复训练系统康复训练装置预训练模型电极片降噪耳机

跨域耕地提取方法、装置、设备、存储介质及程序产品

耕地提取方法图像分割模型预训练模型语义影像

一种基于语义指导多模态融合的小样本动作识别方法

动作识别方法视觉特征样本多模态语义

基于金豺狼优化算法的变压器故障诊断方法

分类准确率重构误差降噪特征表达式编码器

图像文本特征对齐融合的信息抽取方法、设备及程序产品

站点导航

APP 下载