摘要
本发明公开一种基于文本图像对齐的电容检测报告文档检索方法,提取文档图像的语义特征和待搜索关键字的语义特征;图像语义特征和文本语义特征融合得到自注意力对齐修正后的概率特征图;基于所述概率特征图通过设定阈值Hr得到文档图像的二值图Bm,获取文本框位置;基于概率特征图通过设定阈值Ht进行特征选择,提取每个文本行的特征区域,构建出概率特征图上所有存在文本的选择特征集合;基于所述选择特征集合进行GLR预测,得到包含待搜索关键字的位置信息,将位置信息映射到二值图Bm的文本框中,从而得到待搜索关键字在所述输入的文档图像中的位置。此种方法能够实现高效准确地对电容检测报告进行关键词检索和定位。
技术关键词
语义特征
文档检索方法
关键字
文本
图像
注意力
特征选择
报告
多层感知机
电容
关键词
非线性
通道
尺寸
实体
轮廓
矩阵
元素
网络
系统为您推荐了相关专利信息
知识图谱构建技术
模板
工业
文本聚类算法
命名实体识别
变化检测网络
图像块
特征提取模块
模态特征
融合特征
标识符
文本生成方法
集成门控
模块
计算机可执行指令