摘要
本申请公开了一种模型推理加速方法、设备、存储介质和程序产品,涉及人工智能技术领域,包括根据当前算子是否为待卸载算子,若是,在主核上对当前算子的计算任务执行全部计算操作,输出当前算子的计算执行结果;若不是,则在主核上对当前算子的计算任务执行第一计算操作,输出当前算子的第一执行结果,同时在协核上对当前算子的计算任务执行第二计算操作,输出当前算子的第二执行结果,解决了由于禁用外接硬件加速卡且本身性能受限,导致推理速度慢的问题,达到了提高模型推理速度的技术效果;基于中断响应机制,根据第一执行结果和第二执行结果,在主核上生成当前算子的计算执行结果,达到了提高模型推理实时性的技术效果。
技术关键词
描述符
基板管理控制器
队列
编码
可读存储介质
存储计算机程序
人工智能技术
缓冲
字段
计算机程序产品
机制
处理器
总量
电子设备
内存
受限
存储器
速度
系统为您推荐了相关专利信息
机器学习模型
模型部署方法
服务器
显卡
注意力机制
水田杂草
编码器
级联
农业智能化技术
预处理图像数据
缓存管理系统
预训练语言模型
生成全局热力图
负载均衡器
非易失性计算机可读存储介质
深海采矿车
缩尺模型
布放系统
模拟海底环境
扭矩传感器