摘要
本申请提供一种基于多模态大模型的知识结构化抽取方法,涉及数据处理技术领域。包括:根据数据抽取需求,确定待抽取属性信息,并根据待抽取属性信息,生成结构化数据模型;根据结构化数据模型,按照预设的抽取策略,对待处理的原始多模态文件进行数据抽取,得到多个抽取结果;对多个抽取结果进行合并处理,得到合并抽取结果;对合并抽取结果进行校验,得到目标抽取结果。本方法在通过多模态大模型进行知识抽取中,通过多轮抽取结合分阶段抽取的抽取策略,可以降低模型一次抽取的数据量,避免数据抽取遗漏,同时分阶段抽取使得模型可以由粗到细,由全局理解到字段级精抽逐步递进,避免上下文丢失,提升抽取结果的精度。
技术关键词
结构化数据模型
多模态
切块
数据格式
分阶段
策略
数据处理技术
场景
表头
表格
字段
嵌套
精度
图像
关系
系统为您推荐了相关专利信息
多模态信息
多模态用户界面
软件设计框架
意图
界面组件
数据立方体
三维地形模型
实景建模方法
数字表面模型
多模态
风险预警方法
梯级
多模态
滑动窗口
电力系统运行管理
多智能体强化学习
策略
分层注意力
多维特征向量
时序
多模态信息融合
智能检测方法
非线性
数据
深度学习框架