摘要
本发明提供了一种适用于智能图书馆的书籍矫正与分割方法,该方法通过深度霍夫变换网络检测畸变图像中的书籍区域,提取语义线并获取四边形角点坐标;然后根据这些角点坐标,利用透视变换技术对图像进行矫正;最后,采用改进的UNet网络对矫正后的图像进行语义分割。改进后的UNet网络引入VGG16作为编码器以增强特征表达能力,结合哈尔小波下采样以提升特征表征,运用空间和通道双重注意力机制(CBAM)优化特征提取,并通过动态上采样(DySample)实现高精度图像重建,从而达到精准分割的效果。该方法不仅能够有效矫正由拍摄角度变化导致的图像畸变,还在书脊分割任务中展现出优异性能,为智能图书馆的自动化盘点提供了可靠的技术支持。
技术关键词
智能图书馆
分割方法
书籍
矫正
注意力机制
多层感知器
四边形
坐标
图像重建
线性插值方法
通道
语义
网络
全局平均池化
上下文特征
像素
上采样
子模块