基于多模态的图像处理方法和装置、电子设备及存储介质

AITNT
正文
推荐专利
基于多模态的图像处理方法和装置、电子设备及存储介质
申请号:CN202411063890
申请日期:2024-08-02
公开号:CN118918381A
公开日期:2024-11-08
类型:发明专利
摘要
本申请实施例提供了一种基于多模态的图像处理方法和装置、电子设备及存储介质,属于药品计算机视觉技术领域。该方法包括:获取文本信息和图像信息;通过预先训练的图像编码器对所述图像信息进行编码,得到图像向量;通过预先训练的文本编码器对所述文本信息进行编码,得到文本向量;对图像向量和文本向量分别进行特征提取,并对得到的特征进行均值化处理,得到均值特征;对均值特征分别与文本向量和图像向量进行拼接处理,得到文本拼接特征和图像拼接特征;对文本拼接特征和所述图像拼接特征进行融合处理,并对融合特征进行分类输出,得到所述文本信息和所述图像信息的目标分类结果。本申请实施例有利于提升图像处理的准确度。
技术关键词
图像拼接 图像处理方法 融合特征 文本编码器 图像编码器 多模态 池化特征 电子设备 计算机视觉技术 对象 图像处理装置 可读存储介质 处理器 模块 元素 存储器
系统为您推荐了相关专利信息
1
用于图像处理的显示器、图像处理系统及图像处理方法
区域位置信息 图像识别模块 图像增强模块 图像块 输入接口
2
基于神经网络模型的放疗图像信息的融合方法
神经网络模型 融合方法 图像 路径特征 融合特征
3
基于大模型的配电网故障诊断方法、装置、终端及介质
配电网运行数据 动态邻接矩阵 配电网故障诊断 节点特征 融合特征
4
一种基于隐空间特征的细胞分裂状态分类方法及系统
状态分类方法 图像生成器 空间特征提取 编码器训练 训练集
5
一种轴承端盖表面缺陷检测方法、系统、介质及设备
表面缺陷检测方法 轴承端盖 表面缺陷图像 表面缺陷检测系统 对象轮廓
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号