多模态图像分类方法、系统、存储介质及电子设备

AITNT
正文
推荐专利
多模态图像分类方法、系统、存储介质及电子设备
申请号:CN202410733358
申请日期:2024-06-07
公开号:CN118314409B
公开日期:2024-09-13
类型:发明专利
摘要
本发明提供一种多模态图像分类方法、系统、存储介质及电子设备,包括:抽取表示图像汇聚的特殊字符的字符特征;抽取待分类图像的图像特征;基于所述字符特征和所述图像特征获取第一字符向量、第二字符向量和第三字符向量;获取待分类图像的文本描述信息;基于文本描述信息获取第一文本向量、第二文本向量和第三文本向量;将所述第一字符向量、所述第二字符向量、所述第三字符向量、所述第一文本向量、所述第二文本向量和所述第三文本向量均输入分类模型,以获取所述待分类图像的分类结果。本发明的多模态图像分类方法、系统、存储介质及电子设备基于图像、文本等多模态信息实现图像的分类,有效提升了分类准确率。
技术关键词
字符 图像分类方法 文本 多层感知机 图像分类系统 编码器 解码模块 编码模块 解码器 电子设备 多模态 注意力机制 矩阵 分类准确率 存储计算机程序 存储器 可读存储介质
系统为您推荐了相关专利信息
1
一种基于LLM的混合增强Text-to-SQL方法及装置
语句 序列 关键词 语义 动态冗余控制
2
基于动态记忆网络的知识图谱语义增强型嵌入优化方法
动态记忆网络 记忆特征 图谱 语义 逻辑
3
一种自动攻击溯源方法、终端设备及存储介质
攻击溯源方法 日志 条目 单类支持向量机 标记
4
驾驶辅助信息的处理方法、处理装置和电子设备
语义特征 图像编码器 图像分割模型 解码网络 标志物
5
一种基于元问答对的医疗领域大语言模型知识增强方法
大语言模型 测试题 医学知识库 知识库管理 检索标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号