多模态预训练模型的迁移方法和相关产品

正文

推荐专利

多模态预训练模型的迁移方法和相关产品

申请号：CN202510243032

申请日期：2025-03-03

公开号：CN120162741A

公开日期：2025-06-17

类型：发明专利

摘要

本发明公开了一种多模态预训练模型的迁移方法和相关产品。该方法中，为视觉编码器中每一个Transformer编码器模块的每一个注意力头的映射矩阵分配独立的低秩微调项，每一个低秩微调项为独立的A矩阵与独立的B矩阵的乘积，并且为视觉编码器中每一个Transformer编码器模块的每一个注意力头分配独立的门控参数，Transformer编码器模块的输出是根据其自身的各注意力头的输出特征及各注意力头对应的门控参数确定的，门控参数用于调节对应注意力头的权重；将训练样本的文本特征和图像特征输入至输出模块，得到分类损失，根据分类损失对各A矩阵、各B矩阵以及各门控参数进行迭代。该方法提高模型迁移到下游任务上的精度且提高收敛速度。

技术关键词

编码器模块预训练模型迁移方法多模态文本编码器注意力机制矩阵参数输出特征存储器存储指令输入输出模块网络结构图像处理模块处理器样本计算机设备

系统为您推荐了相关专利信息

基于视觉语言大模型的正畸目标位推理

多模态影像数据图像嵌入注意力机制三维模型文本

一种基于因果推理的APT杀伤链重构与预测方法及系统

量子态多源异构数据注意力学习算法节点特征

一种基于多模态交互与自适应学习的电力负荷预测方法

电力负荷预测方法多模态交互负荷预测模型多源异构数据归因

基于AI大语言模型的中医智能问诊方法及系统

智能问诊方法智能问诊系统同义词声音采集器术语

一种烟叶原料模块符合性评价方法、系统、设备及介质

性评价方法感官烟叶原料成品片烟指标

多模态预训练模型的迁移方法和相关产品

站点导航

APP 下载