摘要
本发明涉及一种基于OCR和LLM的费用明细清单识别方法和系统,包括采集待处理图像,检测待处理图像的费用明细区域并截取第一子图;采用OCR识别第一子图获取第一集合,基于第一集合构建仿射变换矩阵进行图片水平校正,并获取水平校正后的第二子图;采用OCR识别第二子图获取第二集合,基于第二集合对第二子图中的文本行进行行列校正,校正后的文本行信息构成第三集合;基于第三集合构建prompt,并结合大型语言模型获取费用明细识别信息。本发明通过多阶段的图像处理和OCR文字识别优化,显著提升复杂条件下文本识别精度;引入大语言模型,赋能空间位置关系理解能力,实现了从文本数据到特定信息提取的智能化飞跃,减少了人工干预,提高了效率。
技术关键词
文本行
水平校正
识别方法
顶点
坐标
矩形
识别模块
图像获取模块
文本识别
矩阵
直线
空间位置关系
大语言模型
像素点
图片
识别系统
系统为您推荐了相关专利信息
自动测量方法
树木胸径
轻量化卷积神经网络
深度成像
主动立体视觉技术
干涉仪误差
校准方法
视觉检测系统
误差参数
反射镜面型
大语言模型
文本生成方法
表达式
文本生成系统
生成提示词
数字高程模型
自动设计方法
纵断面设计
简支梁
道岔梁