摘要
本发明公开了一种基于ConvNeXt V2的档案文档质量评价方法及系统。在本发明中,利用改进的ConvNeXt V2模型对预处理后的档案文档图像进行文字密度分类,并输出概率分布。同时,采用OCR文本‑图像双分支结构的质量评价模型对图像进行质量评价。OCR文本分支使用ViT模型和转置注意力模块提取视觉特征并计算文档流得分;图像分支则利用卷积神经网络和ResNet提取图像特征,通过残差连接形成全局多尺度特征,并计算图像流得分。最终,通过双流动态权重融合图像流和文档流得分,得到图像质量评价得分。本发明通过改进模型架构,并设计了动态权重算法,提升了档案文档图像的分类与质量评价。
技术关键词
评价方法
双分支结构
注意力
文本
多尺度特征
视觉特征提取
计算机电子设备
密度
模块
输出特征
层级
动态
图像块
布局特征
权重算法
存储计算机程序
级联
系统为您推荐了相关专利信息
巷道掘进面
多模态特征
交叉注意力机制
异构
风险
单幅卫星图像
估计方法
通道注意力机制
上采样
编码器
短期电力负荷预测
神经网络模型
门控循环单元
博弈优化算法
超参数