基于大语言模型的多模态文档结构化处理与知识提取方法

正文

推荐专利

申请号：CN202411366962

申请日期：2024-09-29

公开号：CN119227794B

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开了一种基于大语言模型的多模态文档结构化处理与知识提取方法，S1、接收输入的多模态文档；S2、对所述多模态文档中的文本数据进行预处理；S3、对所述多模态文档中的非文本数据进行特征提取；S4、将预处理后的文本数据与特征提取后的非文本数据进行多模态数据融合；S5、通过预先训练的改进BERT模型对所述融合后的多模态数据进行深度语义分析，包括关键实体识别、关系抽取及事件检测；S6、基于所述深度语义分析的结果，自动化地将提取的信息构建知识图谱；S7、将知识图谱的数据输出为可供分析或应用的格式。本发明实现了对非结构化和多模态文档的结构化处理和知识提取。

技术关键词

文本知识提取方法深度语义分析 BERT模型大语言模型语义向量节点构建知识图谱图表实体多模态数据融合数据缓存单元分词模态特征注意力机制条件随机场图像

系统为您推荐了相关专利信息

一种图像的生成方法、系统、设备和介质

图像生成模型关键词嵌入特征图像解码器文本编码器

一种基于历史对话信息的语音识别候选重估方法及系统

语言模型得分文本计算方法语音识别系统语音特征

歌曲解说处理方法、装置、计算机程序产品与电子设备

文本人工智能模型节点场景关键词

虚拟对象交互方法、装置、相关设备和计算机程序产品

虚拟对象文本计算机程序指令客户端交互方法

文档图像的处理方法及装置

注意力大语言模型图像块图像编码器拼接模块

基于大语言模型的多模态文档结构化处理与知识提取方法

站点导航

APP 下载