摘要
本公开的实施例提供一种自适应切割长表格图像实现内容解析的处理方法及系统。应用于信息技术领域,包括:获取文本文件,并转化为图片,将图片输入到布局检测模型中进行分析,根据分析结果得到json文件;对json文件进行处理,提取类别为表格的坐标并进行裁剪获得表格图片;将表格图片输入到自适应图像函数中,对是否需要切割以及是否有切割数量进行判断,得到判断结果,根据判断结果进行VLM解析得到输出结果,系统包括:文本文件处理模块、裁剪模块以及内容解析模块。以此方式,本发明通过利用自适应切割图像和视觉‑语言模型提取长表格图片中的文字信息,显著简化了操作流程,提高了处理效率与准确性。
技术关键词
表格
图片
裁剪模块
坐标
图像分割
布局
语义结构
定位框
分段
视觉
矩形
参数