摘要
本发明公开了一种基于图像识别的数字化档案自动质检方法及系统,涉及基于人工智能的图像识别与处理技术领域,包括,采集图像数据和文本数据,并进行预处理;构建质检多模态转换器模型,将图像质量评分和文本质量评分进行融合,生成质检结果;利用VGG卷积神经网络对质检结果中的图像特征和文本特征进行结构化处理,生成结构化文档;构建增强BERT模型提取结构化文档中的图像特征和文本特征,生成语义分析报告,并自动标注图像质量问题;本发明通过质检多模态转换器模型融合图像质量评分和文本质量评分,实现了跨模态数据的深度整合与分析。
技术关键词
自动质检方法
BERT模型
文本数据提取
注意力机制
文本段落
多模态
图像局部对比度
转换器
自动质检系统
语义
跨模态
表达式
元素
文本规范化
报告
原始图像数据
系统为您推荐了相关专利信息
分割图像数据
分割方法
多尺度
边缘保留滤波
编码器模块
图像分类模型
高维特征向量
评测方法
面部图像特征
人脸皮肤
分级预警系统
分级预警方法
数据采集节点
心理健康监测技术
参数
音频分类方法
多头注意力机制
智能外呼系统
分类网络
机器可读存储介质