摘要
本发明涉及智能移动载体领域,具体为一种多移动载体秩序化作业控制方法,包括以下步骤:模拟真实环境构建仿真环境与移动载体模型,设置强化学习网络框架,定义每个移动载体的观测空间和动作空间;根据移动载体编队与舒适性任务分阶段设计时序奖励函数,所述奖励函数包括移动奖励、编队奖励、状态奖励、加速度奖励以及角加速度奖励。本发明采用了分阶段的思想,从简单的无障碍物场景开始,逐步过渡到包含固定障碍物和动态障碍物的复杂场景,确保了模型在不同环境下的适应性和稳定性,通过设计移动奖励、编队奖励、状态奖励、加速度奖励以及角加速度奖励的奖励函数,能够引导移动载体朝着目标点移动,并在保证效率的同时提升乘客的舒适性。
技术关键词
作业控制方法
强化学习网络
障碍物场景
仿真环境
模拟真实环境
里程计信息
角速度信息
动态障碍物
智能移动载体
激光雷达点云数据
加速度
分阶段
框架
策略
算法
系统为您推荐了相关专利信息
智能模型
指标评估方法
计量方法
测评方法
模糊综合评价法
农业机器人导航
移动机器人
多层感知器
鱼眼相机
图像