基于OCR和LLM的费用明细清单识别方法及系统

正文

推荐专利

申请号：CN202410853316

申请日期：2024-06-28

公开号：CN118747899A

公开日期：2024-10-08

类型：发明专利

摘要

本发明涉及一种基于OCR和LLM的费用明细清单识别方法和系统，包括采集待处理图像，检测待处理图像的费用明细区域并截取第一子图；采用OCR识别第一子图获取第一集合，基于第一集合构建仿射变换矩阵进行图片水平校正，并获取水平校正后的第二子图；采用OCR识别第二子图获取第二集合，基于第二集合对第二子图中的文本行进行行列校正，校正后的文本行信息构成第三集合；基于第三集合构建prompt，并结合大型语言模型获取费用明细识别信息。本发明通过多阶段的图像处理和OCR文字识别优化，显著提升复杂条件下文本识别精度；引入大语言模型，赋能空间位置关系理解能力，实现了从文本数据到特定信息提取的智能化飞跃，减少了人工干预，提高了效率。

技术关键词

文本行水平校正识别方法顶点坐标矩形识别模块图像获取模块文本识别矩阵直线空间位置关系大语言模型像素点图片识别系统

系统为您推荐了相关专利信息

一种采摘装置及采摘方法

采摘装置辅助线采摘方法采摘方式中心线

一种基于深度视觉的树木胸径自动测量方法

自动测量方法树木胸径轻量化卷积神经网络深度成像主动立体视觉技术

干涉仪误差校准方法、装置以及计算机可读存储介质

干涉仪误差校准方法视觉检测系统误差参数反射镜面型

基于大语言模型的申诉文本生成方法、系统、设备和介质

大语言模型文本生成方法表达式文本生成系统生成提示词

铁路站场桥梁孔跨自动设计方法、装置、设备及存储介质

数字高程模型自动设计方法纵断面设计简支梁道岔梁

基于OCR和LLM的费用明细清单识别方法及系统

站点导航

APP 下载