摘要
本发明公开了一种自适应模型分割的边缘计算协同推理方法、介质及设备,方法包括:采用模型应用领域的数据集预训练DNN模型;采用训练后量化方法对DNN模型进行量化;基于DNN模型分层特性分析其分层计算时延与数据输出量并构建模型的有向无环图;采用图论中的网络流图方式生成可行分割策略集合;采用深度Q网络求解动态网络质量下的最优分割策略。该方法采用模型压缩的方法缓解终端设备的存储压力,并通过结合DNN的DAG,利用图论的方法求解DQN的动作空间,解决由于可行分割策略过多导致的动作空间过大的问题,进而提升求解最优分割策略的时间以及推理效率。
技术关键词
DNN模型
推理方法
终端设备
网络流图
深度神经网络模型
大规模异构数据
策略
数据传输时延
DQN算法
更新模型参数
深度强化学习
服务器
深度Q网络
随机梯度下降
处理器
决策
样本
系统为您推荐了相关专利信息
缓冲状态报告
链路状态信息
最小化系统
遗传算法
接入点
降噪方法
数据
深度神经网络模型
输出特征
状态空间模型
功能模块
输入接口
代码生成方法
结构化数据格式
验证平台