摘要
本发明涉及一种基于深度强化学习的人体增强反馈方案动态决策方法,属于深度学习技术领域,解决现有网球训练方法存在的智能化程度较低、灵活性较差、对感觉反馈利用度较低的问题。该方法首先获得若干个转换元组并存储到重播缓冲区中,再利用深度确定性策略梯度算法构建两个深度神经网络,以生成在连续空间下最优的动作策略网络和动作‑价值评价网络,定义依据运动理论计算得到的训练者理论最大击球速度与训练者实际最大击球速度差值的绝对值为奖励函数,对网络进行训练,得到回报最大化的最优装置控制策略。本发明结合训练过程人体运动数据,使网球训练装置智能化,并能根据训练者的训练效果实现网球训练装置实时反馈方案动态决策,实时性更强。
技术关键词
动态决策方法
网球训练装置
深度强化学习
动作策略
机械辅助装置
深度确定性策略梯度
电刺激装置
深度神经网络
采取行动
人体运动数据
更新网络参数
控制策略
随机梯度下降
深度学习技术
灯带
理论
系统为您推荐了相关专利信息
人工气候室控制系统
智能分析决策
多模态数据融合
数字孪生模型
神经网络单元
资源调度方法
拉格朗日对偶
保障通信可靠性
深度Q网络
模型更新
工业机器人
数字孪生模型
SAC算法
更新方法
数字孪生系统
飞播种子
智能优化系统
预测系统
可变刚度
粒子图像测速系统