摘要
本发明涉及一种机器人路径规划方法及系统,属于机器人控制领域。本发明将采集到的连续时刻的机器人状态数据输入到能够有效捕捉环境状态随时间变化的长距离时空依赖关系的ST‑Transformer模型中,然后再将经过该模型编码后的时空特征输入到训练好的Actor网络中,从而得到机器人下一时刻的用于路径规划的动作指令。由于ST‑Transformer模型在时序数据处理上的优势,帮助TD3算法更好地理解机器人当前环境的全局动态信息,从而在动态环境中输出更符合当前环境状态的动作策略。
技术关键词
深度确定性策略梯度
时空注意力机制
连线
网络
算法
实时位置
数据
机器人控制
动作策略
障碍物
规划
编码
运动
处理器
动态
参数
时序
系统为您推荐了相关专利信息
节点特征
预报方法
注意力神经网络
训练样本集
船舶
联合标定方法
智能眼镜
坐标系
数据采集组件
标定设备
线性关系模型
数据滤波算法
电能误差
动环监控系统
电力系统