摘要
本公开提供了一种推理任务处理方法、装置、电子设备及存储介质,涉及人工智能技术领域。该方法应用于边缘设备,包括:接收推理任务;确定多个备选模型中各个备选模型完成推理任务的代价值,每一备选模型的状态包括已在边缘设备创建、待在边缘设备创建和待在中心云创建中的一个;将最小代价值对应的备选模型确定为目标模型;根据目标模型的状态,对推理任务进行处理。此种方式相较于选择默认的模型处理推理任务,具有更高的灵活性,也更加适配资源有限的边缘设备。
技术关键词
标识
参数
计算机程序产品
电子设备
处理器
人工智能技术
时延
指令
模块
可读存储介质
复杂度
令牌
功率
队列
存储器
资源
系统为您推荐了相关专利信息
大语言模型
生成文本内容
三元组
BERT模型
可读存储介质
粉末床熔融设备
金属材料
激光
数据处理模块
参数
随机森林模型
识别方法
异常数据处理
算法
非易失性计算机存储介质
禁忌搜索算法
启发式算法
货物装载方法
序列
集装箱尺寸