摘要
本发明公开了一种GPU显存及计算单元多模型共享方法,包括步骤:S1,对不同模型进行数据处理的各网络层拆分为通用层和区别层,并将每一模型的每一通用层和/或每一区别层分别部署在对应的GPU计算单元上;S2,识别拟运行的模型的网络层拆分结构,并通过负载均衡策略调用第一GPU计算单元执行对识别到的通用层的数据处理,调用第二GPU计算单元执行对识别到的区别层的数据处理。通过对模型拆分部署,模型采用相同的通用层,不同的区别层,模型特征结构实现了复用,避免显存独占,做到显存复用,能够部署更多的模型,充分利用了碎片化的显存空间。
技术关键词
共享方法
负载均衡策略
多模型
数据
决策
算法
系统为您推荐了相关专利信息
学生心理健康
视频数据传输
动态评估方法
视频传输
指数
解析技术
结构化数据模型
生成结构化数据
特征点
可视化图表
图像检测模型
图像预测方法
计算机可读指令
置信度阈值
图像预测装置