一种适用于智能图书馆的书籍矫正与分割方法

正文

推荐专利

申请号：CN202411935062

申请日期：2024-12-26

公开号：CN119762402A

公开日期：2025-04-04

类型：发明专利

摘要

本发明提供了一种适用于智能图书馆的书籍矫正与分割方法，该方法通过深度霍夫变换网络检测畸变图像中的书籍区域，提取语义线并获取四边形角点坐标；然后根据这些角点坐标，利用透视变换技术对图像进行矫正；最后，采用改进的UNet网络对矫正后的图像进行语义分割。改进后的UNet网络引入VGG16作为编码器以增强特征表达能力，结合哈尔小波下采样以提升特征表征，运用空间和通道双重注意力机制(CBAM)优化特征提取，并通过动态上采样(DySample)实现高精度图像重建，从而达到精准分割的效果。该方法不仅能够有效矫正由拍摄角度变化导致的图像畸变，还在书脊分割任务中展现出优异性能，为智能图书馆的自动化盘点提供了可靠的技术支持。

技术关键词

智能图书馆分割方法书籍矫正注意力机制多层感知器四边形坐标图像重建线性插值方法通道语义网络全局平均池化上下文特征像素上采样子模块

一种适用于智能图书馆的书籍矫正与分割方法

站点导航

APP 下载