摘要
本发明公开了一种多模态预训练模型的渐进式微调方法及系统,属于深度学习领域,所述方法包括从已完成预训练的多模态大模型的视觉编码器获取高维的视觉特征向量,并从文本编码器中获取文本特征向量,构建得到异构模态特征;通过资源分配策略分析不同模态的贡献度,动态地指导整个微调过程,将有限的计算资源,分配给对当前任务贡献最大的多模态大模型组件;通过跨模态对比一致性模型对所述异构模态特征进行处理得到最终的优化目标。本发明能够在有限的硬件条件下训练出更大的或使用更大的批次大小进行微调训练。
技术关键词
微调方法
预训练模型
资源分配策略
模态特征
跨模态
文本编码器
文本特征向量
微调系统
桥接模块
多模态
矩阵
浮点数
样本
调度器
检查点技术
异构
动态地
语义
参数
系统为您推荐了相关专利信息
匹配定位方法
稀疏特征
像素点
特征点集合
跨模态
学习方法
编码器
解码器
跨模态数据
多模态数据分析
深度学习特征提取
特征筛选方法
机器学习分类算法
影像组学特征融合
支持向量机