一种基于CPU和GPU协同的混合专家模型推理方法

AITNT
正文
推荐专利
一种基于CPU和GPU协同的混合专家模型推理方法
申请号:CN202510254307
申请日期:2025-03-05
公开号:CN120235253A
公开日期:2025-07-01
类型:发明专利
摘要
本发明公开了一种基于CPU和GPU协同的混合专家模型推理方法,属于深度学习(machine learning)领域。本发明构建混合专家模型的CPU‑GPU计算框架,有效平衡异构计算资源负载,显著提升硬件利用率;且提供基于动态优先级分数的智能缓存管理机制,优先保留高需求专家,降低缓存缺失引发的传输开销;通过分离计算与传输任务的流水线并行设计,实现CPU计算与PCIe传输在GPU执行期间的重叠,有效隐藏延迟。此外,结合多层专家激活预测的前瞻性预取机制,提高专家缓存命中率。本发明兼容不同规模与结构的混合专家模型,在资源受限的异构平台上实现稳定高效的推理加速。
技术关键词
推理方法 队列 预取机制 缓存命中率 异构平台 流水线 高需求 时延 动态 资源 内存 受限 列表 规模 策略 序列 框架 模式
系统为您推荐了相关专利信息
1
一种电力工业协议语义感知异常的解析方法
报文 协议状态机 时间滑动窗口 解析方法 数据
2
基于深度强化学习的两阶段工作流调度方法和系统
工作流调度方法 资源调度模型 阶段 特征值 深度Q网络
3
一种基于BIM的脚手架钢板网搭建方法
钢板网 三维实体模型 脚手架 网格 划分算法
4
一种融合移动边缘计算的风电场巡检方法及系统
风电场巡检 强化学习算法 气象监测设备 风力涡轮机 遗传算法优化
5
一种TSN与MQTT融合的关键数据传输保障方法
数据传输保障机制 保障方法 环境监测数据 报文 定义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号