摘要
本发明公开了一种边缘计算场景下确定性延迟的协同推理方法及系统,获取端边协同推理场景信息,确定用户对推理时延的需求与对推理精度损失的容忍范围;准备候选模型,将目标模型划分为浅层模型和深层模型;在边缘设备添加协同推理调度器与网络带宽监控点;执行端边协同推理,对初始模型进行部署,端设备执行浅层模型,边缘设备执行深层模型,端设备的执行结果基于渐进式传输机制通过网络传输到边缘设备;调度器结合用户对推理时延的需求以及端、边设备计算时延,确定用于网络传输的时延,基于用户对推理精度损失的容忍范围对推理配置进行调整。本方法能够对神经网络模型进行优化训练,并基于实时网络带宽波动选取最优鲁棒性模型执行推理。
技术关键词
推理方法
网络带宽波动
调度器
场景
神经网络模型训练
网络传输时延
数据
推理系统
注意力
精度
机制
鲁棒性
接收端
模块
决策
信道
处理器
系统为您推荐了相关专利信息
消防机器人
无线通讯模块
消防联动系统
联动方法
导航模块
神经网络模型
通道工作状态
数据流特征
剪枝方法
数据类型信息
文本生成模型
样本
语音识别方法
语音翻译方法
模型库
风险评估方法
风险评估模型
风险评估算法
网络分析技术
社会