MoE中专家的资源分配方法、装置、存储介质及设备

AITNT
正文
推荐专利
MoE中专家的资源分配方法、装置、存储介质及设备
申请号:CN202510998794
申请日期:2025-07-21
公开号:CN120994364A
公开日期:2025-11-21
类型:发明专利
摘要
本申请公开了一种MoE中专家的资源分配方法、装置、存储介质及设备,属于人工智能技术领域。监控MoE中各个专家的热度等级;目标专家的热度等级升高时,获取目标专家在第一GPU节点上绑定的第一vGPU实例的资源描述信息;若根据资源描述信息确定能够调整第一vGPU实例的资源,则在第一GPU节点上,根据变化后的热度等级扩展第一vGPU实例的资源;若根据资源描述信息确定不能调整第一vGPU实例的资源,则在第一GPU节点或第二GPU节点上为目标专家绑定第二vGPU实例,并为第二vGPU实例分配资源。本申请能达到根据专家的热度等级联动调整资源的目的,提高了资源利用率,且具备实时性、弹性和推理吞吐能力。
技术关键词
资源分配方法 节点 显卡 资源分配装置 计算机设备 人工智能技术 监控模块 可读存储介质 周期 指令 处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号