摘要
本公开提供了对比学习训练方法、装置、电子设备及存储介质,涉及计算机视觉、深度学习和大模型等人工智能领域。其中的方法可包括:获取M张任意分辨率的训练图像,M为大于1的正整数,利用视觉编码器分别确定出各训练图像的目标视觉特征;获取M段文本内容,所述M段文本内容与M张训练图像一一对应,各文本内容分别用于描述对应的训练图像的图像内容,利用文本编码器分别确定出各文本内容的目标文本特征,所述文本编码器为生成式大语言模型;根据各目标视觉特征和各目标文本特征确定出对比学习损失,根据对比学习损失对视觉编码器和文本编码器进行更新。
技术关键词
视觉特征
文本编码器
图像
学习训练方法
交叉注意力机制
大语言模型
学习训练装置
分辨率
电子设备
多模态
指令
计算机程序产品
计算机视觉
处理器通信
模块
可读存储介质
系统为您推荐了相关专利信息
地基云图
长短期记忆神经网络
超短期功率预测
功率值
非线性优化方法
长波红外波段
异常监测方法
亮度
反演模型
红外相机
路段
地图数据库
路线生成方法
计算机可执行指令
形态
多色光
Canny算子
芯片板
RGB三色光源
DIP元器件