摘要
本发明提供一种基于多模态大模型的文件审核方法、装置以及设备,其中方法包括:对待审核文件中的数据进行拆分,得到待审核文件中的文本数据以及待审核文件中的图像数据;对待审核文件中进行切分,得到多个文本段落;基于预先构建的提示词模板,引导多模态大模型对图像数据中的文本进行识别,调用知识库对图像数据中识别的文本内容进行校验,并引导多模态大模型确定各文本段落的主题,按照段落主题在知识库中进行索引,并基于索引结果分别对多个文本段落进行校验,不仅实现了待审核文件的自动审核过程,还提高了文件审核的效率和准确性。充分利用了多模态大模型的强大处理能力和知识库的丰富信息资源,为文件审核提供了有力的技术支持。
技术关键词
文件审核方法
多模态
文本段落
语句
数据
主题
语义
图像
索引
光学字符识别
模板
基准
关键字
文本识别
校验模块
处理器
识别模块
存储器
样本