摘要
本发明提供了一种基于大模型的文档识别与校核方法及装置,方法包括获取待识别的文档,将所述文档转换成图片格式,将得到的文档图片输入到预训练的视觉大模型中,输出识别到的信息;将所述视觉大模型识别到的信息输入到语言大模型中,通过提示词工程撰写需要提取的字段信息,引导语言大模型对输入信息进行关键词提取,将所需提取的字段信息以结构化的方式输出;配置校核规则,包括构建校核脚本以及校核规则知识库;将输出的数据输入到校核大模型中,校核大模型结合RAG检索增强生成技术构建动态双引擎检索机制,对输入的信息进行校核;生成校核结果,并进行可视化展示。本发明能够提高各类文档识别的准确率和鲁棒性。
技术关键词
校核方法
规则知识库
文档图像数据
生成技术
模糊文档图像
计算机可读取存储介质
融合业务系统
视觉
关键词
数据获取装置
自定义脚本
强化学习算法
段落结构
图片
处理器
注意力机制
核装置
系统为您推荐了相关专利信息
教学系统
个性化学习路径
数据管理模块
隐私保护模块
案件
结构化病历数据
规则知识库
向量检索技术
人工智能模型
JSON格式数据
图像生成器
节点
视觉
语音识别软件
图像生成技术