摘要
本申请公开了一种多硬件混合大模型训练的方法、系统及相关装置,用于简化模型结构,提高模型性能。本申请方法包括:首先,收集多模态数据,构建多模态模型架构,通过对多模态大模型进行基准测试,得到多个硬件的第一性能指标。接着,将接收的计算任务进行分解为若干个子任务,多模态大模型划分成若干个子模型,并根据第一性能指标将子模型和子任务匹配至适合的硬件进行训练。然后,根据计算的综合权重值对信息传递链路进行剪枝操作。再评估第二性能指标,获得性能评估报告,对剪枝操作实施动态调整策略,并执行后续的剪枝操作,在执行剪枝操作后,对子模型进行重新初始化和局部微调。最后,使用测试数据集对多模态大模型进行全面评估。
技术关键词
多模态
硬件资源利用率
报告
性能指标数据
信息熵
输入输出单元
动态
策略
样本
链路
虚拟化技术
可读存储介质
申请方法
周期
基准
分配单元
存储器
程序
系统为您推荐了相关专利信息
多模态生物识别
会议室管理方法
人体感应器
温湿度感应器
远程门禁控制
医疗不良事件
防控方法
风险预测模型
节点特征
高风险
智能反馈数据
训练系统
呼吸传感器
柔性可穿戴传感器
儿童