摘要
本发明涉及深度强化学习领域,尤其涉及基于深度确定性策略梯度的云机器人协同任务卸载方法。包括如下步骤:(1)将其简化为包裹分拣与分发的应用程序。(2)设计并实现一种面向云机器人的端边云协同任务卸载架构。(3)将卸载问题归纳为一个具有延迟、能耗和资源约束的多目标优化问题。(4)在边缘服务器中进行模型的离线训练,并保存模型以供在线决策使用。(5)边缘服务器快速生成任务卸载决策,由主机器人执行任务的分配与整合。本发明的有益效果在于,支持离线训练再在线决策,将在线决策的复杂性转移到离线训练阶段,可以快速适应工业互联网环境中资源和任务需求的动态变化,实现稳定的算法收敛和优化效果。
技术关键词
深度确定性策略梯度
辅助机器人
服务器
决策
卸载方法
时延
能耗
云机器人
工业互联网
送货机器人
网络
功率
阶段
抓取物品
包裹
通信机器人
个性化包装
协助机器人
离线
系统为您推荐了相关专利信息
机器学习模型
计算机可执行指令
因子
决策树模型
地质灾害预测技术
控制系统
强化学习框架
PID控制算法
多模态
融合多传感器数据