面向非结构化PDF文档的多模态语义理解方法及系统

AITNT
正文
推荐专利
面向非结构化PDF文档的多模态语义理解方法及系统
申请号:CN202511430775
申请日期:2025-10-09
公开号:CN120975098A
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了面向非结构化PDF文档的多模态语义理解方法及系统,涉及数据处理相关领域,该方法包括:调取关系型知识表示预案对目标PDF文档进行分析,得到目标关系框架,并对目标关系框架进行跨模态对齐处理,得到目标对齐框架;对目标对齐框架进行多模态交互分析,得到目标融合信息;基于目标融合信息对目标PDF文档进行重构处理,得到目标重构文档;将目标重构文档的语义信息作为目标PDF文档的多模态语义理解。解决了现有面向非结构化PDF文档的多模态语义理解存在的模态语义关联缺失与交互不足,导致语义理解精度不足的技术问题,达到了通过整合文档中的多模态信息,提高语义理解精度的技术效果。
技术关键词
语义理解方法 框架 多模态交互 跨模态 实体 文本 关系建模 视觉 图像超分辨率重构 字符 语义理解系统 依赖特征 金字塔池化 图文混排 多尺度 策略
系统为您推荐了相关专利信息
1
一种基于大语言模型的复杂文本OCR错误识别和修复方法
大语言模型 修复方法 识别模块 文本处理技术 实体
2
基于大语言模型的问答方法、装置、设备和存储介质
大语言模型 文本 数据处理算法 算法数据处理 问答方法
3
一种元宇宙场景“云-边-端”协作缓存方法
协作缓存方法 动态时间规整算法 场景 缓存命中率 轨迹
4
一种光接收器、光接收模组和电子设备
透镜 光接收器 正面 圆柱状 引线框架
5
基于动态多目标优化的库存分布决策方法及系统
决策方法 数据 货架 订单 策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号