摘要
本发明提供一种基于深度强化学习的人形机器人、投篮方法及存储介质,涉及人形机器人和深度强化学习领域。该方法包括:将人形机器人投篮任务划分为三个子任务:靠近球、拿起球、投篮,利用深度强化学习训练得到每个子任务的决策模型,人形机器人利用训练得到的模型进行动作决策完成投篮任务。本发明将人形机器人投篮的过程划分为感知、决策、控制三个模块,感知模块通过卷积神经网络和注意力机制进行表征学习,决策模块通过改进经的SAC算法进行动作决策,控制通过执行预定义的动作组实现动作的执行。
技术关键词
人形机器人
深度强化学习
机器人控制模块
决策
网络
训练场景
投篮机器人
仿真环境
通道注意力机制
感知周围环境
训练机器人
SAC算法
输入设备
篮筐
图像特征提取
投篮动作
系统为您推荐了相关专利信息
企业数据防篡改
客户端
电力设备运行状态
加密算法
文本
异常检测方法
沿海内河船舶
指令
传感器
循环冗余校验
强化学习网络
自动驾驶决策方法
融合先验知识
驾驶决策模型
车辆状态信息
机器学习技术
反馈系统
生理
数据处理模块
数据采集模块