一种数据处理方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510458050

申请日期：2025-04-11

公开号：CN120526284A

公开日期：2025-08-22

类型：发明专利

摘要

本公开关于一种数据处理方法、装置、电子设备及存储介质，该方法通过对视觉内容和问题文本分别进行特征表示以得到视觉特征和文本特征，并根据视觉特征确定视觉模态的视觉基向量，根据文本特征确定文本模态的文本基向量，进而基于视觉基向量对文本特征进行视觉模态映射处理以得到第一模态特征，并基于文本基向量对视觉特征进行文本模态映射处理以得到第二模态特征，基于该第一模态特征和第二模态特征进行文本预测得到输出文本，从而能够更加有效的理解多模态内容中的细粒度信息，使得在高层次的多模态任务如细粒度感知任务、认知任务与情感任务上的准确性大大提高。

技术关键词

模态特征文本视觉特征注意力跨模态数据处理方法样本多模态融合特征电子设备处理器可读存储介质数据处理装置大语言模型计算机程序产品答案高层次指令

系统为您推荐了相关专利信息

一种物流无人机起降点选取方法、装置、设备、介质及产品

物流无人机无人机起降点点选取方法深度强化学习方法坐标

基于赛事信息可靠传输的线上体育赛事活动管理系统

活动管理系统主题文本分词分析模块

一种基于多任务协同学习的多模图像融合识别方法及系统

图像融合识别方法分辨率多任务解码器多模态特征

一种基于图卷积神经网络的能源管理方法、设备及介质

能源管理方法皮尔逊相关系数引入注意力机制非易失性计算机存储介质计算机可执行指令

一种基于客户行为生成对话文本的方法及相关产品

文本客户可读存储介质存储计算机程序人工智能技术

一种数据处理方法、装置、电子设备及存储介质

站点导航

APP 下载