摘要
本发明提出一种手推车智能收集机器人调度方法及系统,包括以下步骤:S1,初始化机场环境状态和构建神经网络分层强化学习高层策略和低层策略;S2,定义奖励函数;S3,高层策略决定每个智能行李手推车收集机器人的任务类型;S4,低层策略基于高层策略的决定,为每个智能行李手推车收集机器人选择具体的目标位置;S5,执行低层策略动作并更新机场环境状态;S6,经验存储与回访;S7,引入价值函数更新高层策略和低层策略;S8,重复训练S3‑S7,直至满足停止条件;本发明用分层强化学习方法实现手推车智能收集机器人对手推车的收集、分发或调度。
技术关键词
收集机器人
智能行李
手推车
机器人控制模块
分层强化学习
神经网络参数
分层策略
服务器
调度系统
定义
损耗
误差
电池
因子
样本
速度
系统为您推荐了相关专利信息
护理机器人
运动特征
预测控制方法
奇异值分解算法
隐性特征
机器人本体
防护气囊
电磁
防护盒
智能机器人技术
蛇形机器人
震动检测装置
磁吸爬行
控制中心
安装箱
抗扰控制方法
无人艇
高海况
智能模型
分层递阶控制
工位机器人
机器人工作空间
终端设备
卷积神经网络模型
堆叠方式