一种GPU显存及计算单元多模型共享方法

AITNT
正文
推荐专利
一种GPU显存及计算单元多模型共享方法
申请号:CN202510717138
申请日期:2025-05-30
公开号:CN120634838A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种GPU显存及计算单元多模型共享方法,包括步骤:S1,对不同模型进行数据处理的各网络层拆分为通用层和区别层,并将每一模型的每一通用层和/或每一区别层分别部署在对应的GPU计算单元上;S2,识别拟运行的模型的网络层拆分结构,并通过负载均衡策略调用第一GPU计算单元执行对识别到的通用层的数据处理,调用第二GPU计算单元执行对识别到的区别层的数据处理。通过对模型拆分部署,模型采用相同的通用层,不同的区别层,模型特征结构实现了复用,避免显存独占,做到显存复用,能够部署更多的模型,充分利用了碎片化的显存空间。
技术关键词
共享方法 负载均衡策略 多模型 数据 决策 算法
系统为您推荐了相关专利信息
1
一种基于深度学习的学生心理健康动态评估方法及系统
学生心理健康 视频数据传输 动态评估方法 视频传输 指数
2
多模态图纸解析技术及系统
解析技术 结构化数据模型 生成结构化数据 特征点 可视化图表
3
结构冲击载荷识别方法、系统、介质及设备
冲击载荷识别方法 样条 信号 对象 网络模型训练
4
基于人工智能的图像预测方法、装置、计算机设备及介质
图像检测模型 图像预测方法 计算机可读指令 置信度阈值 图像预测装置
5
一种坝式路基涵洞设计方法、系统、存储介质及电子设备
土壤侵蚀模型 涵洞 路基 边坡 栅格
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号