摘要
本申请实施例涉及算力调度领域,公开了一种智能推断系统、方法、设备及介质。系统包括基座模型,用于进行共享参数的推断过程;多个适配器模型,每个所述适配器模型用于进行推断任务的推断过程;所述基座模型于所述适配器模型分离独立部署,支持多个所述适配器模型在一个基座模型上并行推断;智能路由器,用于接收并分析推断任务,根据预设的规则选择对应的所述适配器模型,将所述适配器模型加载到对应的推断节点。通过引入LoRA模型的适配器设计和智能路由器机制,实现了低显存环境下多专家模型的高效部署和推断,能够显著降低显存使用,同时提高推断响应速度。可以至少用以解决专家模型推断效率低的技术问题。
技术关键词
适配器
智能路由器
推断系统
计算机程序指令
基座
节点
推断方法
机器学习模型
电子设备
处理器
参数
介质
资源
机制
存储器
策略
动态
模块
系统为您推荐了相关专利信息
生成控制指令
机械臂基座
复现方法
运动捕捉系统
坐标系
光学定位系统
融合控制方法
手术机器人
反光标记
坐标系
canny算子
像素点
对比度
计算机程序指令
边缘检测
实时数据处理
多模态
计算机程序指令
机器学习模型
动态特征选择