摘要
本发明公开了一种多模态数据处理方法、装置、存储介质及电子设备。其中,所述方法包括:获取待识别的多模态数据,所述多模态数据包括图像数据和文本数据;获取所述图像数据对应的图像嵌入向量,基于预训练融合词表将所述图像嵌入向量转换为预融合编码向量;所述预训练融合词表为根据图像训练样本得到的用于减少图像特征的编码量的编码本;将所述预融合编码向量和文本数据对应的文本嵌入向量进行组合,得到目标多模态向量。本发明解决了相关技术中多模态大语言模型占用计算资源较多,难以有效地理解和融合多模态信息,整体性能不佳的技术问题。
技术关键词
图像训练样本
图像嵌入
图像编码
图像处理模型
编码向量
数据识别模型
文本
融合多模态信息
生成重构图像
生成对抗网络
电子设备
数据处理装置
大语言模型
存储器
系统为您推荐了相关专利信息
图像特征提取
识别模型构建方法
网络
微表情识别方法
控制模块
情感识别方法
情感特征
平行语料库
多语言
语义向量
日前优化调度方法
双层优化模型
配电网运行数据
节点
配电网系统