多模融合与结构化知识驱动的复杂文件理解方法及系统

正文

推荐专利

申请号：CN202510770519

申请日期：2025-06-10

公开号：CN120671676A

公开日期：2025-09-19

类型：发明专利

摘要

本发明公开了一种多模融合与结构化知识驱动的复杂文件理解方法及系统，该方法包括：针对复杂文件提取多模态特征；在高维语义空间映射多模态特征，构建结构化语义数据；采用领域知识库检索结构化语义数据的背景信息；基于结构化语义数据及对应的背景信息，生成目标文件。从而，通过多模态特征提取与跨模态注意力对齐机制，对多模态数据实现有效提取，进而在高维语义空间实现语义对齐与自适应权重分配，确保多模态信息一致性，消除语义断层与信息冲突，辅以结构化知识驱动，大幅增强对专业术语、隐含逻辑与上下文关联内容的解析能力，输出质量高，可针对于不同应用场景准确输出，适用范围广。

技术关键词

多模态特征多头注意力机制关系抽取算法数据画像上下文语义信息神经网络推理生成自然语言主题实体多模态信息场景理解系统策略核心特征提取模块图谱

系统为您推荐了相关专利信息

一种骨科器械的识别检测方法及系统

骨科器械识别检测方法图像类别手术工具骨板

一种智能应答方法、装置、终端设备及存储介质

智能应答方法表格实体语句智能应答装置

一种多类型小说创作平台

创作平台语句读者长短期记忆网络标签

一种纳米级显微物镜下自动对焦装置及方法

深度学习网络结构卷积神经网络模型长短期记忆网络运动平台数据获取模块

半导体器件和半导体系统

I3C总线命令半导体系统控制器处理单元

多模融合与结构化知识驱动的复杂文件理解方法及系统

站点导航

APP 下载