一种GPU显存及计算单元多模型共享方法

正文

推荐专利

一种GPU显存及计算单元多模型共享方法

申请号：CN202510717138

申请日期：2025-05-30

公开号：CN120634838A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种GPU显存及计算单元多模型共享方法，包括步骤：S1，对不同模型进行数据处理的各网络层拆分为通用层和区别层，并将每一模型的每一通用层和/或每一区别层分别部署在对应的GPU计算单元上；S2，识别拟运行的模型的网络层拆分结构，并通过负载均衡策略调用第一GPU计算单元执行对识别到的通用层的数据处理，调用第二GPU计算单元执行对识别到的区别层的数据处理。通过对模型拆分部署，模型采用相同的通用层，不同的区别层，模型特征结构实现了复用，避免显存独占，做到显存复用，能够部署更多的模型，充分利用了碎片化的显存空间。

技术关键词

共享方法负载均衡策略多模型数据决策算法

系统为您推荐了相关专利信息

一种基于深度学习的学生心理健康动态评估方法及系统

学生心理健康视频数据传输动态评估方法视频传输指数

多模态图纸解析技术及系统

解析技术结构化数据模型生成结构化数据特征点可视化图表

结构冲击载荷识别方法、系统、介质及设备

冲击载荷识别方法样条信号对象网络模型训练

基于人工智能的图像预测方法、装置、计算机设备及介质

图像检测模型图像预测方法计算机可读指令置信度阈值图像预测装置

一种坝式路基涵洞设计方法、系统、存储介质及电子设备

土壤侵蚀模型涵洞路基边坡栅格

一种GPU显存及计算单元多模型共享方法

站点导航

APP 下载