摘要
本发明涉及自然语言处理技术领域,尤其涉及一种基于多模态大模型档案结构化信息提取方法、系统及介质,该方法包括步骤:S1,建立待提取字段映射表;S2,数据标注;S3,构建版面分析模型、档案结构化提取模型以及档案结构化整合模型;S4,基于版面分析模型,筛选关键信息页;S5,基于档案结构化提取模型,提取单页结构化信息;S6,基于档案结构化整合模型,整合单页结构化信息结果。通过多模态大模型的应用,实现精准的版面分析,强大的结构化提取能力,以及高效的信息整合,实现了从档案图像数据到结构化信息的自动化提取和整合,减少了人工干预,提高了处理效率。
技术关键词
结构化信息提取方法
关键字
多模态
信息页
数据
计算机可读取存储介质
字段
文本分析器
信息提取系统
图像
列表
页面图片
优化器
人事档案
样本
大语言模型
格式
处理器
编码
系统为您推荐了相关专利信息
机器学习模型
检测测试结构
模拟工具
数据
随机森林模型
采集设备
数据采集方法
数据采集器
可执行程序代码
数据传输方式
匹配优化方法
顶点
分析查询日志
统一资源标识符
邻居