基于OCR和LLM的费用明细清单识别方法及系统

AITNT
正文
推荐专利
基于OCR和LLM的费用明细清单识别方法及系统
申请号:CN202410853316
申请日期:2024-06-28
公开号:CN118747899A
公开日期:2024-10-08
类型:发明专利
摘要
本发明涉及一种基于OCR和LLM的费用明细清单识别方法和系统,包括采集待处理图像,检测待处理图像的费用明细区域并截取第一子图;采用OCR识别第一子图获取第一集合,基于第一集合构建仿射变换矩阵进行图片水平校正,并获取水平校正后的第二子图;采用OCR识别第二子图获取第二集合,基于第二集合对第二子图中的文本行进行行列校正,校正后的文本行信息构成第三集合;基于第三集合构建prompt,并结合大型语言模型获取费用明细识别信息。本发明通过多阶段的图像处理和OCR文字识别优化,显著提升复杂条件下文本识别精度;引入大语言模型,赋能空间位置关系理解能力,实现了从文本数据到特定信息提取的智能化飞跃,减少了人工干预,提高了效率。
技术关键词
文本行 水平校正 识别方法 顶点 坐标 矩形 识别模块 图像获取模块 文本识别 矩阵 直线 空间位置关系 大语言模型 像素点 图片 识别系统
系统为您推荐了相关专利信息
1
一种采摘装置及采摘方法
采摘装置 辅助线 采摘方法 采摘方式 中心线
2
一种基于深度视觉的树木胸径自动测量方法
自动测量方法 树木胸径 轻量化卷积神经网络 深度成像 主动立体视觉技术
3
干涉仪误差校准方法、装置以及计算机可读存储介质
干涉仪误差 校准方法 视觉检测系统 误差参数 反射镜面型
4
基于大语言模型的申诉文本生成方法、系统、设备和介质
大语言模型 文本生成方法 表达式 文本生成系统 生成提示词
5
铁路站场桥梁孔跨自动设计方法、装置、设备及存储介质
数字高程模型 自动设计方法 纵断面设计 简支梁 道岔梁
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号