一种基于多模型协同的表格检测结构化输出方法、装置设备和存储介质

正文

推荐专利

申请号：CN202510217002

申请日期：2025-02-26

公开号：CN120148045A

公开日期：2025-06-13

类型：发明专利

摘要

本申请涉及表格识别技术领域,尤其涉及一种基于多模型协同的表格检测结构化输出方法、装置设备和存储介质，包括：响应对于目标表格的检测指令，获取包含目标表格的表格图片；使用预先训练的深度学习表格检测模型对图像进行目标检测，根据检测的结果得到表格的位置坐标；再使用预先训练的深度学习文字检测模型对图像进行目标检测，根据检测结果得到文字的位置坐标和文字类别；根据文字类别调用不同的文字识别模型进行文字内容识别，将上述的表格位置坐标，文字位置坐标、文字内容进行处理，输出表格文字内容和表格坐标，将输出送入大语言模型，得到最后的文本键值对匹配结果。本发明有助于减少人工干预和误识别，提升自动化处理的效率和准确度。

技术关键词

结构化输出方法多模型协同坐标大语言模型表格识别技术键值文本图像矩形图片印刷体处理器元素识别模块指令存储器像素电子设备

系统为您推荐了相关专利信息

一种电表箱运行状态实时检测方法

状态实时检测数据电表箱时间序列分解方法符号

一种基于竞拍算法的电力巡检无人机调度方法及系统

无人机巡检路径电力巡检无人机分段路径特征构建无人机

基于大模型的数据处理方法、装置、电子设备、可读存储介质、计算机程序产品和搜索产品

数据处理方法日志分析单元场景分类计算机程序产品

施工机械的周边监视装置

物体检测装置周边监视装置校正算法施工机械坐标系

一种面向复杂环境的三维语义占用感知方法及装置

全景环视图像语义特征交叉注意力机制坐标系解码器

一种基于多模型协同的表格检测结构化输出方法、装置设备和存储介质

站点导航

APP 下载