一种基于文本图像对齐的电容检测报告文档检索方法

AITNT
正文
推荐专利
一种基于文本图像对齐的电容检测报告文档检索方法
申请号:CN202410709765
申请日期:2024-06-03
公开号:CN118606498B
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开一种基于文本图像对齐的电容检测报告文档检索方法,提取文档图像的语义特征和待搜索关键字的语义特征;图像语义特征和文本语义特征融合得到自注意力对齐修正后的概率特征图;基于所述概率特征图通过设定阈值Hr得到文档图像的二值图Bm,获取文本框位置;基于概率特征图通过设定阈值Ht进行特征选择,提取每个文本行的特征区域,构建出概率特征图上所有存在文本的选择特征集合;基于所述选择特征集合进行GLR预测,得到包含待搜索关键字的位置信息,将位置信息映射到二值图Bm的文本框中,从而得到待搜索关键字在所述输入的文档图像中的位置。此种方法能够实现高效准确地对电容检测报告进行关键词检索和定位。
技术关键词
语义特征 文档检索方法 关键字 文本 图像 注意力 特征选择 报告 多层感知机 电容 关键词 非线性 通道 尺寸 实体 轮廓 矩阵 元素 网络
系统为您推荐了相关专利信息
1
工业场景中大模型提示词设计方法、系统、设备及介质
知识图谱构建技术 模板 工业 文本聚类算法 命名实体识别
2
基于掩膜的自监督多模态遥感图像变化检测方法及系统
变化检测网络 图像块 特征提取模块 模态特征 融合特征
3
一种病灶分割模型的训练方法、装置、设备及存储介质
病灶尺寸 列表 神经网络模型 病灶分割方法 切片
4
点云数据的压缩方法、装置、电子设备以及存储介质
深度值 图像 点云 特征提取网络 机器学习模型
5
AI生成模型训练、文本生成方法及电子设备
标识符 文本生成方法 集成门控 模块 计算机可执行指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号