摘要
本发明公开了一种融合轻量级网络与传统图像算法的文档前景识别方法,属于数字图像处理技术领域,技术方案包括:构建RGB与Sobel边缘特征融合的四通道输入以增强轮廓感知;采用10层MobileNetV3‑UNet网络实现轻量化特征提取;基于区域生长算法对初始掩码动态优化,设定生长阈值为掩码最大值的7%;训练阶段初期采用二元交叉熵损失函数,当验证集IoU连续5轮提升<0.1%时(定义为瓶颈期),切换至Focal Loss函数;该方法在复杂背景下,模型经FP16量化与50%剪枝后体积由86MB压缩至43MB,训练周期仅需2.1 GPU小时,适用于离线文档处理场景,显著提升复杂背景下的识别精度与效率。
技术关键词
前景识别方法
像素掩码矩阵
区域生长算法
编码器
样本
数字图像处理技术
焦点损失函数
多尺度特征融合
结构网络
种子
通道
瓶颈
标签
处理器
两阶段
可读存储介质
存储器
系统为您推荐了相关专利信息
深度学习算法
稀疏重构算法
像素点
深度学习计算机视觉
运动
强化学习模型
协同优化方法
节点特征
神经网络模型
配电网系统
地震断层识别方法
注意力
多尺度
表达式
输出特征