基于多模态大模型档案结构化信息提取方法、系统及介质

正文

推荐专利

申请号：CN202510872525

申请日期：2025-06-26

公开号：CN120853204A

公开日期：2025-10-28

类型：发明专利

摘要

本发明涉及自然语言处理技术领域，尤其涉及一种基于多模态大模型档案结构化信息提取方法、系统及介质，该方法包括步骤：S1，建立待提取字段映射表；S2，数据标注；S3，构建版面分析模型、档案结构化提取模型以及档案结构化整合模型；S4，基于版面分析模型，筛选关键信息页；S5，基于档案结构化提取模型，提取单页结构化信息；S6，基于档案结构化整合模型，整合单页结构化信息结果。通过多模态大模型的应用，实现精准的版面分析，强大的结构化提取能力，以及高效的信息整合，实现了从档案图像数据到结构化信息的自动化提取和整合，减少了人工干预，提高了处理效率。

技术关键词

结构化信息提取方法关键字多模态信息页数据计算机可读取存储介质字段文本分析器信息提取系统图像列表页面图片优化器人事档案样本大语言模型格式处理器编码

系统为您推荐了相关专利信息

一种集成公路建管养数据并进行三维展示的方法

百米桩公路病害路面养护三维模型坐标

测试结构的设计方法、存储介质及终端

机器学习模型检测测试结构模拟工具数据随机森林模型

一种数据采集方法、系统、数据采集器及分布式系统

采集设备数据采集方法数据采集器可执行程序代码数据传输方式

基于顶点热度缓存的子图匹配优化方法

匹配优化方法顶点分析查询日志统一资源标识符邻居

一种基于林业生态数据的森林资源数据分析方法及系统

植被生态数据分析方法网格电子地图

基于多模态大模型档案结构化信息提取方法、系统及介质

站点导航

APP 下载