基于图像识别的文化资源数字化实现方法

AITNT
正文
推荐专利
基于图像识别的文化资源数字化实现方法
申请号:CN202511150753
申请日期:2025-08-18
公开号:CN120747986B
公开日期:2025-11-04
类型:发明专利
摘要
本申请实施例提供了基于图像识别的文化资源数字化实现方法,在方法中,基于文本边缘定位和非文本区域过滤提取增强图像中的文本候选区,利用DB分割算法对文本候选区进行文本分割,对分割得到的文本行图像进行分段处理,第一文本段的段尾与第二文本段的段首之间具有重合文本段;利用文本识别模型分别对第一文本段和第二文本段进行文本识别,将得到的重合文本段的识别结果用于文本识别模型的优化调整;将新的待识别图像作为优化调整后文本识别模型的输入,得到当前待识别图像的文本识别结果,构建包含文本识别结果的文化资源数据库并输出。本申请实施例可以将古籍文献等图像信息进行数字化,构建便于管理和应用的文化资源数据库。
技术关键词
文本识别模型 文本行 图像 GoogLeNet模型 风格 资源 特征提取模块 分割算法 时序特征 注意力机制 材质特征 编码器 Sigmoid函数 解码器 可变形卷积层
系统为您推荐了相关专利信息
1
医学图像分割方法、装置、设备及介质
医学图像分割方法 注意力 图像分割模型 关键点 解码模块
2
一种基于扩散模型的三维形状描述方法
图像嵌入 多视角 文本 三维模型 噪声强度
3
基于多模态AI大模型的消防救援智能管理方法及系统
火灾现场 智能管理方法 热成像 环境监测数据 智能消防救援
4
基于全身CT扫描图像和神经网络模型的体脂率估算方法
CT扫描图像 神经网络模型 连续横截面 人体全身 内脏
5
用于红外弱小目标检测的动态上下文感知金字塔网络及红外弱小目标检测方法
动态上下文 金字塔网络 滤波模块 融合语义 生成多尺度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号