摘要
本公开提供了一种信息提取方法、装置、存储介质及电子设备。该方法包括:通过多模态提取模型,对初始文件集合进行文本提取,得到文本信息集合,初始文件集合包括至少一种文件格式;基于文本信息集合中的第一文本信息,通过向量数据库进行向量检索,并通过分析模型在向量检索得到的检索结果中确定与第一文本信息对应的目标标准信息集合,目标标准信息集合用于生成结构化数据,向量数据库为对多个标准信息进行向量转换得到的。本公开的方法,通过多模态提取模型可以对多种文件格式的文件进行文本提取,扩大了适用范围,并通过并行进行向量检索和分析模型进行分析处理,以提取得到标准化信息,提高标准化信息提取的准确性,并提高了信息提取的效率。
技术关键词
文本
生成结构化数据
信息提取方法
结构化数据格式
字段
多模态
信息提取装置
电子设备
处理器
参数
可读存储介质
模块
计算机
关系
系统为您推荐了相关专利信息
控制面板
二维位置信息
生成指令序列
多模态
机器人
多模态
大语言模型
机器学习模型
生成方法
沙盒环境
物资调度方法
物联网终端
无人机
多模态
微动特征