基于OCR多模态大模型的表格数据提取方法

AITNT
正文
推荐专利
基于OCR多模态大模型的表格数据提取方法
申请号:CN202411672916
申请日期:2024-11-21
公开号:CN119600628A
公开日期:2025-03-11
类型:发明专利
摘要
本发明提供一种基于OCR多模态大模型的表格数据提取方法,包括数据载体获取与表格数据判断;图片格式表格的OCR识别;构建大模型Prompt语句;图片格式表格的语言大模型处理;图片格式表格的多模态处理;确定非图片格式的数据载体中表格数据对应的json数据结构;结果比对与模式选择;模型优化执行和领域字典更新;模型与字典集成测试;系统性能监控与自适应调整。本发明克服了现有技术中格式专一性的问题,增强了工具对不同领域表格数据的适应性,能够使系统随着处理数据量的增加不断提升性能。
技术关键词
表格数据提取方法 数据载体 表头 分析页面 修正字典 定位文字区域 图形绘制功能 图片 语义 语句 系统性能监控 分析数据特征 文本 样式 视觉 数据格式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号