基于多模态文档信息配置提取的方法及系统

AITNT
正文
推荐专利
基于多模态文档信息配置提取的方法及系统
申请号:CN202411056081
申请日期:2024-08-02
公开号:CN118865419B
公开日期:2025-06-10
类型:发明专利
摘要
本发明提供基于多模态文档信息配置提取的方法及系统,方法包括:对文档初步分析,识别文件类型与格式,文档预处理;根据文档类型与内容分布选择最适配的识别模式,配置相应识别参数;针对不同类型识别结果,采用定制化提取策略和识别提取规则,按类别设定提取要素;确定每项识别提取规则对应的文档页码位置,精确提取所需信息;将提取结果回调;记录保存识别提取规则及识别提取配置。本发明在多种维度上精确定义提取范围,提高提取过程精准性和适应性;设计处理正则表达式匹配结果重叠问题算法,提高高亮处理准确性和文档可读性;提供图形用户界面,允许用户直观地预览识别结果及高亮效果,支持即时反馈和调整,提升了用户操作的直观性和便捷性。
技术关键词
多模态 表格 缓存机制 合并单元格 图形用户界面 上传方式 保证系统安全性 文本 格式 索引 计算机设备 定义提取 参数 关键词 处理器 坐标 元素 信息模块 分辨率 数据
系统为您推荐了相关专利信息
1
一种基于多模态大模型的智能语音数据缺陷检测方法
缺陷检测方法 智能语音 答案 多模态 样本
2
一种燃气轮机燃烧状态控制方法及系统
状态控制方法 燃烧室 异常状态 信号分析系统 燃烧组件
3
一种虚拟模型的处理方法、装置、电子设备和存储介质
关键帧 顶点 贴图 动画 图形用户界面
4
多模态数据存储方法、装置、电子设备、存储介质及程序产品
数据关联信息 标签 多模态 数据存储方法 计算机程序指令
5
基于知识图谱的数据挖掘方法、查询方法和问答方法
人工智能模型 节点 拓展单元 生成知识图谱 人机交互界面
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号