摘要
基于元强化学习的高效DNN推理任务划分策略属于物联网、边缘智能领域,用于解决环境突然变动会导致划分策略需要频繁执行重新采样与模型再训练问题,进而提高系统DNN推理任务执行效率。首先确定边端架构,然后根据边端架构建立系统模型、通信模型和计算模型,进一步建立联合优化模型。将制定的联合优化模型建模为马尔可夫决策过程,建立深度强化学习模型,结合元学习算法的优点,采用一阶近似元强化学习算法来求解原模型中的最优划分问题。在动态多变的环境下即使环境不断接收新任务或者新数据,元强化学习仍能够持续学习,不断积累经验从而快速达到收敛,提高整体系统处理任务效率。
技术关键词
智能设备
深度强化学习模型
代表
服务器
终端设备
设备端
时延
微基站
系统架构模型
贪婪算法
策略
决策
元学习算法
物联网场景
宏基站
定义
强化学习算法
最小化系统
系统为您推荐了相关专利信息
安装配件
终端
可视化交互界面
电器设备
性能指标信息
图像编码
水印生成方法
文本
编码向量
图像识别模型
区域位置信息
图像理解方法
编码向量
多尺度
语义特征