摘要
本发明公开了一种基于改进SAC算法的四足机器人步态生成方法,包括:获取四足机器人的当前状态数据和动作数据;基于动作数据得到新状态数据;设置多维度奖励函数,并与当前状态数据、动作数据和新状态数据组成元组数据;基于元组数据输入至由演员网络和多头评论家网络构成的智能体,得到动态权重和动作值;基于动态权重和动作值得到混合策略梯度;基于混合策略梯度和损失函数分别对演员网络和多头评论家网络进行训练,得到训练好的演员网络和训练好的多头评论家网络;获取四足机器人的当前状态数据并输入至训练好的演员网络和训练好的多头评论家网络,得到优化步态数据。提升了四足机器人的步态生成效率和步态鲁棒性。
技术关键词
机器人步态
SAC算法
四足机器人
生成方法
动态
数据采集模块
网络优化
拼接模块
输出模块
机器人本体
关节
生成系统
策略
能量消耗
样本
鲁棒性
参数
系统为您推荐了相关专利信息
物联网大数据
策略
时间间隔特征
场景
数据分析算法
控制调节方法
数据预处理终端
综合评估模型
学生
策略
环境风险评估方法
风险量化评估
网络流量数据
异构
策略