多模态预训练模型的迁移方法和相关产品

AITNT
正文
推荐专利
多模态预训练模型的迁移方法和相关产品
申请号:CN202510243032
申请日期:2025-03-03
公开号:CN120162741A
公开日期:2025-06-17
类型:发明专利
摘要
本发明公开了一种多模态预训练模型的迁移方法和相关产品。该方法中,为视觉编码器中每一个Transformer编码器模块的每一个注意力头的映射矩阵分配独立的低秩微调项,每一个低秩微调项为独立的A矩阵与独立的B矩阵的乘积,并且为视觉编码器中每一个Transformer编码器模块的每一个注意力头分配独立的门控参数,Transformer编码器模块的输出是根据其自身的各注意力头的输出特征及各注意力头对应的门控参数确定的,门控参数用于调节对应注意力头的权重;将训练样本的文本特征和图像特征输入至输出模块,得到分类损失,根据分类损失对各A矩阵、各B矩阵以及各门控参数进行迭代。该方法提高模型迁移到下游任务上的精度且提高收敛速度。
技术关键词
编码器模块 预训练模型 迁移方法 多模态 文本编码器 注意力机制 矩阵 参数 输出特征 存储器存储指令 输入输出模块 网络结构 图像处理模块 处理器 样本 计算机设备
系统为您推荐了相关专利信息
1
基于视觉语言大模型的正畸目标位推理
多模态影像数据 图像嵌入 注意力机制 三维模型 文本
2
一种基于因果推理的APT杀伤链重构与预测方法及系统
量子态 多源异构数据 注意力 学习算法 节点特征
3
一种基于多模态交互与自适应学习的电力负荷预测方法
电力负荷预测方法 多模态交互 负荷预测模型 多源异构数据 归因
4
基于AI大语言模型的中医智能问诊方法及系统
智能问诊方法 智能问诊系统 同义词 声音采集器 术语
5
一种烟叶原料模块符合性评价方法、系统、设备及介质
性评价方法 感官 烟叶原料 成品片烟 指标
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号