一种智能推断系统、方法、设备及介质

AITNT
正文
推荐专利
一种智能推断系统、方法、设备及介质
申请号:CN202510161209
申请日期:2025-02-13
公开号:CN120106213A
公开日期:2025-06-06
类型:发明专利
摘要
本申请实施例涉及算力调度领域,公开了一种智能推断系统、方法、设备及介质。系统包括基座模型,用于进行共享参数的推断过程;多个适配器模型,每个所述适配器模型用于进行推断任务的推断过程;所述基座模型于所述适配器模型分离独立部署,支持多个所述适配器模型在一个基座模型上并行推断;智能路由器,用于接收并分析推断任务,根据预设的规则选择对应的所述适配器模型,将所述适配器模型加载到对应的推断节点。通过引入LoRA模型的适配器设计和智能路由器机制,实现了低显存环境下多专家模型的高效部署和推断,能够显著降低显存使用,同时提高推断响应速度。可以至少用以解决专家模型推断效率低的技术问题。
技术关键词
适配器 智能路由器 推断系统 计算机程序指令 基座 节点 推断方法 机器学习模型 电子设备 处理器 参数 介质 资源 机制 存储器 策略 动态 模块
系统为您推荐了相关专利信息
1
基于运动捕捉与姿态重建的灭火动作机械臂仿真复现方法
生成控制指令 机械臂基座 复现方法 运动捕捉系统 坐标系
2
基于相机参数模型的训练数据语义合成方法、装置及设备
轮廓图像 模板 语义 轮廓区域 相机
3
手术机器人光力信息融合控制方法、系统、设备及介质
光学定位系统 融合控制方法 手术机器人 反光标记 坐标系
4
一种粉料研磨质量检测方法及系统
canny算子 像素点 对比度 计算机程序指令 边缘检测
5
用于监测异常交易的方法、装置、介质和程序产品
实时数据处理 多模态 计算机程序指令 机器学习模型 动态特征选择
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号