摘要
本发明公开了一种计算与通信效率跨模态模型协同训练方法和系统,训练方法包括如下步骤:采用融合局部感知与全局语义关联的混合网络结构,结合结构重参数化技术压缩模型规模以构建轻量化跨模态基础模型架构;构建极简特征适配模块,在跨模态基础模型架构的输出端添加极简特征适配模块,通过逐步缩减其参数量至极简线性变换形式,实现本地特征差异化调优,同时减少通信传输数据量;在本地训练中,通过对比公共参考数据集与本地数据的特征分布差异,最小化分布距离损失函数,促使各参与方的特征空间逐步对齐;服务器端维护全局特征适配模块参数,各参与方基于本地数据对模块进行微调后上传更新,通过加权平均实现全局模型优化。
技术关键词
协同训练方法
跨模态
通信效率
参数化技术
信息瓶颈理论
混合网络结构
融合卷积网络
训练系统
模块
图像编码器
生成特征
注意力机制
客户端特征
规模
语义
分布式特征
基础
复杂度
系统为您推荐了相关专利信息
内容数据生成方法
注意力
音频特征
视觉特征
跨模态
异构语言
对齐模块
视觉特征
跨模态
计算机可执行指令
并行策略
搜索方法
混合整数规划模型
元胞自动机
量子退火算法
数据脱敏方法
跨模态
分类器
三元组
交叉注意力机制