摘要
本发明公开的属于机器人技术领域,具体为全局轨迹策略强化学习方法及机器人控制系统,包括具体步骤如下:S1,环境建模与状态定义:先收集环境数据,接着根据收集到的环境信息,定义机器人的状态空间,对机器人自身的位置、姿态、传感器数据以及任务目标信息进行编码,转化为可被算法处理的状态向量;S2,动作空间设定:明确机器人在场景下可执行的所有动作,并将其离散化或连续化处理形成动作空间。本发明不仅能够提高路径规划响应速度,有效避免碰撞,还能够极大增强机器人在动态环境中的适应能力。
技术关键词
机器人控制系统
动作策略
强化学习方法
强化学习算法
深度确定性策略梯度
网络
环境地图数据
指令
在线学习技术
数据采集模块
滤波模块
收集机器人
存储机器人
编码模块
场景
图像特征向量
系统为您推荐了相关专利信息
路面附着系数
新能源汽车制动
压力控制方法
动态时间规整算法
深度强化学习算法
涂层机器人
底座系统
磨抛系统
机器人控制系统
装备
多模态
PID控制器
图像编码器
SAC算法
多层感知器