多模态模型训练方法、装置及电子设备

正文

推荐专利

多模态模型训练方法、装置及电子设备

申请号：CN202511541394

申请日期：2025-10-27

公开号：CN121010855A

公开日期：2025-11-25

类型：发明专利

摘要

本申请提供一种多模态模型训练方法、装置及电子设备，该方法包括：获取训练图像集中N个类别的类别文本信息；获取多模态模型中文本编码器基于N个类别的类别文本信息得到的N个第一文本特征向量。根据N个第一文本特征向量确定N个第一文本特征向量在球面坐标系下的极角以及辅助角；根据N个第一文本特征向量的极角中的最大值对N个第一文本特征向量的极角进行调大；根据N个第一文本特征向量、辅助角以及调整后的极角，确定在笛卡尔坐标系下N个第二文本特征向量；基于N个第二文本特征向量以及训练图像集，对多模态模型中的图像编码器进行训练，得到训练后的多模态模型，训练后的多模态模型用于图像分类。以提升多训练后的模态模型性能。

技术关键词

文本特征向量图像特征向量图像编码器笛卡尔坐标系多模态文本编码器模型训练方法电子设备处理器球面模型训练装置分类场景可读存储介质计算机程序产品矩阵模块

多模态模型训练方法、装置及电子设备

站点导航

APP 下载