摘要
本发明涉及图像信息处理领域,公开了一种图像信息结构化方法、装置、设备及存储介质,包括:输入待识别图像;对所述图像,利用视觉编码器提取多尺度视觉特征向量;将所述多尺度视觉特征向量与文本属性语义空间匹配,得到对应的细粒度属性文本。解决了现有技术中图像与文本细节匹配度低的问题。
技术关键词
结构化方法
视觉特征
多尺度
语义
文本编码器
结构化装置
专用标识
可读存储介质
处理器
注意力机制
基础
序列
图像分割
信息处理
计算机设备
系统为您推荐了相关专利信息
成分识别方法
多尺度特征
交叉注意力机制
局部特征提取
特征提取模块
语义特征
智能检测系统
三维卷积神经网络模型
三维点云模型
空洞卷积神经网络