摘要
本发明属于人工智能技术领域,公开了一种图像的分类方法、装置、设备及存储介质,该分类方法包括:获取目标图像和目标文本,目标文本为目标图像对应的文本描述;将目标图像输入图像编码器,得到目标图像对应的图像编码序列;将目标文本输入文本编码器,得到目标文本对应的文本编码序列;拼接图像编码序列和文本编码序列,得到拼接序列;将拼接序列输入预设编码器,输出表示目标图像全局信息的目标图像向量,以及表示目标文本全局信息的目标文本向量;将目标图像向量和目标文本向量输入分类模块,得到目标图像的分类结果。本发明解决了现有技术中基于图像识别的分类的方式无法针对图像的细节分类的问题。
技术关键词
分类方法
图像全局信息
标签
序列
文本编码器
图像编码器
编码模块
注意力
可读存储介质
语句
人工智能技术
处理器
分类装置
拼接模块
计算机设备
存储器
系统为您推荐了相关专利信息
识别判定方法
轨迹模型
动火作业
光学图像数据
红外热成像设备
图像分类方法
图像分类模型
计算机可读指令
图像纹理特征提取
分类场景