多模态图像分类方法、系统、存储介质及电子设备

正文

推荐专利

申请号：CN202410733358

申请日期：2024-06-07

公开号：CN118314409B

公开日期：2024-09-13

类型：发明专利

摘要

本发明提供一种多模态图像分类方法、系统、存储介质及电子设备，包括：抽取表示图像汇聚的特殊字符的字符特征；抽取待分类图像的图像特征；基于所述字符特征和所述图像特征获取第一字符向量、第二字符向量和第三字符向量；获取待分类图像的文本描述信息；基于文本描述信息获取第一文本向量、第二文本向量和第三文本向量；将所述第一字符向量、所述第二字符向量、所述第三字符向量、所述第一文本向量、所述第二文本向量和所述第三文本向量均输入分类模型，以获取所述待分类图像的分类结果。本发明的多模态图像分类方法、系统、存储介质及电子设备基于图像、文本等多模态信息实现图像的分类，有效提升了分类准确率。

技术关键词

字符图像分类方法文本多层感知机图像分类系统编码器解码模块编码模块解码器电子设备多模态注意力机制矩阵分类准确率存储计算机程序存储器可读存储介质

系统为您推荐了相关专利信息

一种基于LLM的混合增强Text-to-SQL方法及装置

语句序列关键词语义动态冗余控制

基于动态记忆网络的知识图谱语义增强型嵌入优化方法

动态记忆网络记忆特征图谱语义逻辑

一种自动攻击溯源方法、终端设备及存储介质

攻击溯源方法日志条目单类支持向量机标记

驾驶辅助信息的处理方法、处理装置和电子设备

语义特征图像编码器图像分割模型解码网络标志物

一种基于元问答对的医疗领域大语言模型知识增强方法

大语言模型测试题医学知识库知识库管理检索标签

多模态图像分类方法、系统、存储介质及电子设备

站点导航

APP 下载