一种利用大模型优化扫描件内容识别质量的方法与框架

正文

推荐专利

申请号：CN202510907459

申请日期：2025-07-02

公开号：CN120689894A

公开日期：2025-09-23

类型：发明专利

摘要

本发明涉及人工智能技术领域，尤其涉及一种利用大模型优化扫描件内容识别质量的方法与框架。本发明包括文档图像分析与处理、文字提取与格式化以及利用大模型进行基于上下文的OCR矫正。本发明的目的在于提供一种利用大模型优化扫描件内容识别质量的方法与框架，结合了视觉模型和文本模型等大型语言模型的强大功能，实现了对文档内容和布局的深度理解，精准分析文档布局，识别文本块、表格、图像等不同元素，结合视觉模型的分析结果，将文档内容转换成优美流畅的Markdown格式，并保留文档的原始布局。

技术关键词

噪声数据图像超分辨率重建文档解析技术定位识别技术保留图像边缘识别文本块框架矫正答案布局图像处理算法深度学习技术格式化图片人工智能技术图像分析边缘检测饱和度

系统为您推荐了相关专利信息

基于数据挖掘的客服业务故障预防方法、装置、电子设备、存储介质及程序产品

K折交叉验证法客服系统变量故障预防方法策略

一种基于燃气场站三维模型的应急处理方法、系统及终端

三维模型三维点云数据燃气告警设备全息展示

图像超分辨率重建方法、装置、设备、介质及程序产品

变换特征残差模块轮廓信息积层输出特征

基于对抗特征聚合的联邦大模型学习方法及多方计算系统

模型学习方法计算机执行指令噪声数据生成噪声集群

基于DSP处理器的本地扩声与远程交互方法、系统及设备

远程交互方法人声回声消除处理器麦克风设备

一种利用大模型优化扫描件内容识别质量的方法与框架

站点导航

APP 下载