一种模型资源管理方法及计算设备
站点导航
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
AI需求对接
APP 下载
iOS 下载
安卓下载
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
清空
确定
AITNT
正文
推荐专利
一种模型资源管理方法及计算设备
申请号:
CN202510262561
申请日期:
2025-03-06
公开号:
CN120339034A
公开日期:
2025-07-18
类型:
发明专利
摘要
本申请提供一种模型资源管理方法,应用于服务器,服务器部署有用于处理不同任务的多个模型,方法包括:响应于接收到用户请求,根据用户请求所请求执行任务的类型,从多个模型中确定目标模型以处理用户请求;获取目标模型处理多个用户请求的性能指标统计数据;根据性能指标统计数据为目标模型调整显存资源。由此,可以根据模型的运行需求管理显存资源,提高系统的资源利用效率和提升用户体验。
技术关键词
模型资源管理方法
周期
服务器
存储器
程序
处理器
速率
场景
沪ICP备2023015588号