摘要
本发明实施例公开了一种点胶路径规划方法、网络训练方法、点胶设备及介质。方法包括获取点胶任务中点胶头的当前位置及各待点胶点位的访问状态;将当前位置及各访问状态输入至预先训练的深度Q网络的主网络中,根据输出的主网络Q值确定下一点胶点位;在深度Q网络中,在点胶头由当前位置移动至下一位置时,根据点胶设备的加速、减速及均速运动过程,确定点胶运动时间;根据点胶运动时间确定奖励函数,以奖励函数为优化目标;根据下一点胶点位更新点胶头的当前位置及各访问状态,返回通过主网络确定下一点胶点位步骤直至访问全部点胶点位得到点胶路径规划结果。在点胶路径规划中考虑实际的加减速过程对运动时间的影响,提高点胶路径规划的时效性。
技术关键词
深度Q网络
点胶路径
点胶设备
路径规划方法
运动平台
网络训练方法
运动控制器
点胶头
参数
处理器
点胶动作
可读存储介质
短距离
计算机程序产品
因子
系统为您推荐了相关专利信息
车辆
路径规划方法
重叠面积
生成栅格地图
路径规划系统
路径规划方法
波导阵列
可读存储介质
上存储计算机程序
路径规划技术