用于处理多模态数据的方法、装置、介质和程序产品

正文

推荐专利

申请号：CN202411386418

申请日期：2024-09-29

公开号：CN119272009B

公开日期：2025-09-19

类型：发明专利

摘要

本申请提供了一种用于处理多模态数据的方法、装置、电子设备、计算机可读介质和计算机程序产品。本申请的方法包括：通过将待处理数据的文本内容进行词表征处理，得到文本特征向量；如果待处理数据包含预定数量的图片，则通过提取每一张图片的图片特征并将图片特征映射至文本特征空间，得到图片特征向量，如果待处理数据中图片张数小于预定数量，则在将图片特征映射至文本特征空间后，对映射结果根据预设的输入序列长度进行零填充；将所述文本特征向量和所述图片特征向量进行特征融合得到的多模态融合特征，作为多模态模型的输入；训练所述多模态模型，以在多模态模型中基于输入的多模态融合特征输出预定预测任务的预测结果。本申请实现了使用一个模型来同时处理纯文本数据和包含文本和图片的数据，节省了计算资源。

技术关键词

文本特征向量图片多模态融合特征序列卷积神经网络模型计算机程序指令数据计算机程序产品电子设备处理器通信风险介质存储器

系统为您推荐了相关专利信息

一种基于格拉姆混合场的锂电池健康状态估计方法

锂电池健康状态彩色图像数据时间序列特征锂电池充电电流深度学习模型

查询语句生成方法、装置及设备

实体查询语句生成方法注意力细粒度分类生成提示词

用于预测温度的转炉多源异构数据模型生成系统及方法

生成系统显示设备输入终端构建机器学习模型异构

婴儿癫痫性痉挛综合征的辅助检测系统、装置和方法

辅助检测系统婴儿痉挛多模态信息融合生理

一种数据检测方法、乳腺结节检测模型训练方法及电子设备

结节检测队列数据检测方法乳腺检测超声

用于处理多模态数据的方法、装置、介质和程序产品

站点导航

APP 下载