摘要
本公开的实施例提供了一种图文关联方法及相关设备。图文关联方法包括:提取图像中的第一密度区域和第二密度区域;将第一密度区域分割为第一块,将第二密度区域分割为第二块;将第一块通过第一特征提取模型进行处理,获得图像的第一特征信息;将第二块通过第二特征提取模型进行处理,获得图像的第二特征信息;融合第一特征信息和第二特征信息,获得融合特征信息;根据融合特征信息获得图像的文字描述信息;将图像和文字描述信息分别输入至多模态模型的视觉编码器和语言编码器进行处理,获得图像和文字描述信息的匹配度;根据匹配度满足条件的文字描述信息获得图像的说明文字,并将说明文字与图像关联。
技术关键词
融合特征
特征提取模型
语言编码器
密度
图像
复杂度
处理单元
图文
特征信息融合
像素
训练语言模型
全局平均池化
处理器
关联装置
计算机程序产品
纹理
节点
存储装置
语义
直方图
系统为您推荐了相关专利信息
高效预测方法
描述符
多任务深度神经网络
光谱特征提取
特征提取模型
预测特征
多层注意力机制
数据处理方法
邻居
实体
表面裂缝检测方法
航空发动机叶片
直方图均衡化
裂缝数量
模块
追踪方法
追踪装置
遗传算法求解
矩阵
图像处理技术