一种基于多模态的文档内容匹配方法及系统

正文

推荐专利

一种基于多模态的文档内容匹配方法及系统

申请号：CN202510654917

申请日期：2025-05-21

公开号：CN120182990A

公开日期：2025-06-20

类型：发明专利

摘要

本发明公开了一种基于多模态的文档内容匹配方法及系统，包括获取待识别图像并对待识别图像进行预处理；对预处理的待识别图像进行图片方向矫正，得到矫正图像；对矫正图像进行OCR文字识别并标记文本框；基于文本框对矫正图像进行文本方向矫正，得到矫正文本；基于矫正文本进行多模态文档信息抽取，并对抽取的多模态文档信息进行模态互补增强处理；将处理后的多模态文档信息进行信息匹配并返回匹配结果。本发明通过对多模态的文本内容、文本位置等多种数据源特征进行深度特征融合、跨模态关联、模态互补性增强、泛化能力及效率等方面的改进，显著提升了多模态文档信息抽取及文档内容匹配的准确性和实用性。

技术关键词

内容匹配方法内容匹配系统矫正多模态 OCR文字识别分辨率关键点关键字文本行匹配模块键值深度特征融合识别模块标记图片印章图像处理模块

系统为您推荐了相关专利信息

机器人辅助心脏瓣膜导管术的深度估计模块、控制系统及方法

心脏瓣膜机器人末端执行器立体图像深度图机器人运动学模型

一种基于多模态融合的驾驶行为分类的方法和装置

分支数据序列频域特征双向长短期记忆网络

一种基于多模态融合的餐后血糖趋势预测方法及装置

血糖趋势预测方法图像编码器多模态曲线特征图片

一种基于政务大模型的数据治理方法及系统

政务数据治理方法多模态特征融合深度学习框架机器可读程序

基于多模态融合的乳腺癌新辅助信息分析系统

信息分析系统金字塔生成多尺度多模态卷积特征

一种基于多模态的文档内容匹配方法及系统

站点导航

APP 下载