摘要
本发明涉及人工智能与智能审计技术领域,公开了基于多模态大模型的智能审计方法,包括以下步骤:包括:S1、图像预处理;S2、基于多模态大模型进行深度特征提取;S3、动态调整OCR识别参数;S4、通过语义理解模块对OCR识别结果进行上下文分析;S5、采用数据增强技术,扩展训练数据集;S6、利用并行计算和硬件加速技术;S7、将OCR识别结果转化为结构化数据格式。本发明通过采用基于图文融合建模与分层语义解析的技术方案,达到了多模态文档信息的统一识别与结构理解的技术效果,相较于现有技术中图像与文本处理分离导致语义错位与上下文脱节的技术方案,解决了异构模态信息融合度低、上下文推理能力弱的问题。
技术关键词
智能审计方法
多模态
硬件加速技术
深度特征提取
结构化数据格式
文本
图像
类间方差
直方图均衡化方法
语义
注意力机制
强化学习策略
迁移学习方法
数据输出接口
对比度
复杂度
审计技术
深度学习模型
动态
系统为您推荐了相关专利信息
车辆行驶信息
图像处理方法
车机
电子终端
图像处理装置
智能巡检方法
生物力学模型
声学特征
智能手套
多模态数据融合
全生命周期数据
数据全生命周期
化管理方法
阶段
嵌入特征
事件抽取方法
图像特征提取模型
文本
元素
计算机可执行指令