摘要
本申请实施例提供了基于图像识别的文化资源数字化实现方法,在方法中,基于文本边缘定位和非文本区域过滤提取增强图像中的文本候选区,利用DB分割算法对文本候选区进行文本分割,对分割得到的文本行图像进行分段处理,第一文本段的段尾与第二文本段的段首之间具有重合文本段;利用文本识别模型分别对第一文本段和第二文本段进行文本识别,将得到的重合文本段的识别结果用于文本识别模型的优化调整;将新的待识别图像作为优化调整后文本识别模型的输入,得到当前待识别图像的文本识别结果,构建包含文本识别结果的文化资源数据库并输出。本申请实施例可以将古籍文献等图像信息进行数字化,构建便于管理和应用的文化资源数据库。
技术关键词
文本识别模型
文本行
图像
GoogLeNet模型
风格
资源
特征提取模块
分割算法
时序特征
注意力机制
材质特征
编码器
Sigmoid函数
解码器
可变形卷积层
系统为您推荐了相关专利信息
医学图像分割方法
注意力
图像分割模型
关键点
解码模块
火灾现场
智能管理方法
热成像
环境监测数据
智能消防救援
CT扫描图像
神经网络模型
连续横截面
人体全身
内脏
动态上下文
金字塔网络
滤波模块
融合语义
生成多尺度