摘要
本申请提供了一种结合文字信息的绘本图像识别方法及系统,涉及绘本图像识别领域。该方法包括:获取待识别的绘本图像,并通过OCR对所述待识别的绘本图像中的文字数据进行提取,得到绘本文字数据;对所述待识别的绘本图像进行特征提取,得到图像特征;将所述绘本文字数据和所述图像特征进行融合,得到绘本的多模态表示;将所述绘本的多模态表示与预设的绘本特征库进行比对,得到绘本匹配结果;根据所述绘本匹配结果和所述绘本的多模态表示对所述待识别的绘本图像进行绘本图像识别,得到绘本识别结果。通过上述技术方案提高了绘本图像的识别能力。
技术关键词
图像识别方法
模板特征
多层次特征提取
文本检测模型
图像识别系统
可读存储介质
多尺度
特征提取模块
收发器
数据获取模块
注意力机制
设备通信
电子设备
存储器
匹配模块
处理器
指令
识别模块
系统为您推荐了相关专利信息
智能识别方法
多义词
文本检测模型
参数估计法
图片
计算方法
图像识别方法
还原算法
体积计算公式
容积
遥感图像识别方法
图像块
注意力机制
遥感图像识别技术
非暂态计算机可读存储介质