图像的分类方法、装置、设备及存储介质

AITNT
正文
推荐专利
图像的分类方法、装置、设备及存储介质
申请号:CN202411745586
申请日期:2024-11-28
公开号:CN119600365A
公开日期:2025-03-11
类型:发明专利
摘要
本发明属于人工智能技术领域,公开了一种图像的分类方法、装置、设备及存储介质,该分类方法包括:获取目标图像和目标文本,目标文本为目标图像对应的文本描述;将目标图像输入图像编码器,得到目标图像对应的图像编码序列;将目标文本输入文本编码器,得到目标文本对应的文本编码序列;拼接图像编码序列和文本编码序列,得到拼接序列;将拼接序列输入预设编码器,输出表示目标图像全局信息的目标图像向量,以及表示目标文本全局信息的目标文本向量;将目标图像向量和目标文本向量输入分类模块,得到目标图像的分类结果。本发明解决了现有技术中基于图像识别的分类的方式无法针对图像的细节分类的问题。
技术关键词
分类方法 图像全局信息 标签 序列 文本编码器 图像编码器 编码模块 注意力 可读存储介质 语句 人工智能技术 处理器 分类装置 拼接模块 计算机设备 存储器
系统为您推荐了相关专利信息
1
一种基于机器视觉的动火作业违章识别判定方法
识别判定方法 轨迹模型 动火作业 光学图像数据 红外热成像设备
2
一种基于特征相似度的动作分割网络优化方法
网络优化方法 视频段 特征提取网络 代表 序列
3
一种基于决策Transformer的移动机器人策略模仿方法
移动机器人 决策 规划 轨迹优化方法 坐标系
4
一种图像分类方法、装置、设备及其存储介质
图像分类方法 图像分类模型 计算机可读指令 图像纹理特征提取 分类场景
5
订单备注信息的处理方法、介质、设备和程序产品
订单 大语言模型 关键词 标签 处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号