基于图像识别的文化资源数字化实现方法

正文

推荐专利

基于图像识别的文化资源数字化实现方法

申请号：CN202511150753

申请日期：2025-08-18

公开号：CN120747986B

公开日期：2025-11-04

类型：发明专利

摘要

本申请实施例提供了基于图像识别的文化资源数字化实现方法，在方法中，基于文本边缘定位和非文本区域过滤提取增强图像中的文本候选区，利用DB分割算法对文本候选区进行文本分割，对分割得到的文本行图像进行分段处理，第一文本段的段尾与第二文本段的段首之间具有重合文本段；利用文本识别模型分别对第一文本段和第二文本段进行文本识别，将得到的重合文本段的识别结果用于文本识别模型的优化调整；将新的待识别图像作为优化调整后文本识别模型的输入，得到当前待识别图像的文本识别结果，构建包含文本识别结果的文化资源数据库并输出。本申请实施例可以将古籍文献等图像信息进行数字化，构建便于管理和应用的文化资源数据库。

技术关键词

文本识别模型文本行图像 GoogLeNet模型风格资源特征提取模块分割算法时序特征注意力机制材质特征编码器 Sigmoid函数解码器可变形卷积层

系统为您推荐了相关专利信息

医学图像分割方法、装置、设备及介质

医学图像分割方法注意力图像分割模型关键点解码模块

一种基于扩散模型的三维形状描述方法

图像嵌入多视角文本三维模型噪声强度

基于多模态AI大模型的消防救援智能管理方法及系统

火灾现场智能管理方法热成像环境监测数据智能消防救援

基于全身CT扫描图像和神经网络模型的体脂率估算方法

CT扫描图像神经网络模型连续横截面人体全身内脏

用于红外弱小目标检测的动态上下文感知金字塔网络及红外弱小目标检测方法

动态上下文金字塔网络滤波模块融合语义生成多尺度

基于图像识别的文化资源数字化实现方法

站点导航

APP 下载