摘要
本申请公开了一种模型训练方法、虚拟教练指导策略的生成方法,涉及计算机技术领域。该方法包括:获取用户执行当前训练动作后的当前状态;其中,当前状态包括:动作质量得分、疲劳程度得分、自我满意度得分、理解程度得分以及运动设备的传感器数据中任意多项将当前状态输入DQN模型,得到预设的动作空间中各个策略的Q值;基于各个策略的Q值,从动作空间中选择当前策略;执行当前策略;在用户响应当前策略执行下一训练动作后,获取用户的下一状态;基于当前状态、下一状态以及当前策略,调整DQN模型的参数。该实施方式能够为用户提供更具针对性的训练指导,提高用户的训练质量。
技术关键词
运动设备
策略
模型训练方法
生成方法
传感器
深度Q网络
计算机程序产品
数据
参数
指令
基础
处理器
编码
数值
系统为您推荐了相关专利信息
综合能源系统
优化调度策略
储能设备
充电桩集群
光储充一体化系统
联合损失函数
特征金字塔
图像
感知损失函数
注意力
超声机器人
驱动器控制方法
负刚度结构
六维力传感器
磁铁组