结合文字信息的绘本图像识别方法及系统

AITNT
正文
推荐专利
结合文字信息的绘本图像识别方法及系统
申请号:CN202411050263
申请日期:2024-08-01
公开号:CN119068500A
公开日期:2024-12-03
类型:发明专利
摘要
本申请提供了一种结合文字信息的绘本图像识别方法及系统,涉及绘本图像识别领域。该方法包括:获取待识别的绘本图像,并通过OCR对所述待识别的绘本图像中的文字数据进行提取,得到绘本文字数据;对所述待识别的绘本图像进行特征提取,得到图像特征;将所述绘本文字数据和所述图像特征进行融合,得到绘本的多模态表示;将所述绘本的多模态表示与预设的绘本特征库进行比对,得到绘本匹配结果;根据所述绘本匹配结果和所述绘本的多模态表示对所述待识别的绘本图像进行绘本图像识别,得到绘本识别结果。通过上述技术方案提高了绘本图像的识别能力。
技术关键词
图像识别方法 模板特征 多层次特征提取 文本检测模型 图像识别系统 可读存储介质 多尺度 特征提取模块 收发器 数据获取模块 注意力机制 设备通信 电子设备 存储器 匹配模块 处理器 指令 识别模块
系统为您推荐了相关专利信息
1
一种文档智能识别方法和计算机设备
智能识别方法 多义词 文本检测模型 参数估计法 图片
2
基于显式空间和隐对数关系提示的图像识别方法
图像识别方法 学生 教师 多层感知机 分段
3
应用于库区的液位测量装置、库区容积计算方法及系统
计算方法 图像识别方法 还原算法 体积计算公式 容积
4
遥感图像识别方法、模型及装置
遥感图像识别方法 图像块 注意力机制 遥感图像识别技术 非暂态计算机可读存储介质
5
一种复杂光照环境下的图像识别方法及系统
像素块 光照 图像识别方法 图像识别模型 像素点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号