一种多专家模型推理方法、装置、设备以及存储介质

正文

推荐专利

申请号：CN202510244348

申请日期：2025-03-03

公开号：CN120196433A

公开日期：2025-06-24

类型：发明专利

摘要

本发明提供了一种多专家模型推理方法、装置、设备以及存储介质，旨在多专家模型推理的过程中，减少多级内存间专家模型交换的次数，以提升多专家模型的推理效率。该系统在离线阶段，测量各专家模型的性能，并得到最优的内存分配方案，以合理的分配内存来存储专家模型的参数和推理中间量。在在线阶段，推理请求调度模块调度推理请求到合适的推理执行器队列等待推理。批处理划分模块根据专家性能和可用内存将请求进行批量处理。专家管理模块在需要进行专家交换的时候，卸载未来使用概率最小的专家，加载所需的专家。本发明降低了多专家模型推理过程中专家交换的次数，提升了推理的效率。

技术关键词

推理系统执行器推理方法生成配置信息模块内存占用量队列卸载方法离线感知系统两阶段参数数据异构批量在线处理器

系统为您推荐了相关专利信息

基于力控和神经动态模型的双臂机器人翻箱技能学习方法

神经动态模型双臂机器人学习方法机器人基坐标系刚度

一种基于深度学习的指型板对接故障检测方法及系统

故障检测方法孔洞圆心两板语义分割模型

基于环境感知和动态特征分析的语音声纹识别方法及系统

动态矩阵音频特征降噪模型声纹识别方法

海上风电低频输电系统电网主动支撑控制方法

低频输电系统支撑控制方法虚拟同步机电流控制模块励磁模块

一种基于多模态融合的智能语言学习方法

语言学习内容智能语言学习方法模态特征梅尔频率倒谱系数短时傅里叶变换

一种多专家模型推理方法、装置、设备以及存储介质

站点导航

APP 下载