摘要
本发明涉及足式机器人迁移学习运动控制应用方法、装置及存储介质,采用近端策略优化算法对源域足式机器人模型进行训练,获得行走策略并提取源域足式机器人的策略网络,将源域足式机器人的策略网络参数迁移至目标域足式机器人模型,在训练目标域足式机器人模型时,冻结目标域足式机器人的策略网络的部分层,对未冻结层参数进行训练,以获得目标域足式机器人的运动控制策略。将源域足式机器人的策略网络参数直接应用于目标域足式机器人模型,对未冻结层参数进行训练,在减少训练参数与时间的同时,确保模型适配目标域足式机器人。采用近端策略优化算法对源域足式机器人模型进行训练,获得收敛的策略网络,为后续迁移提供可靠先验知识。
技术关键词
机器人模型
足式机器人
网络
机器人跨平台
标识符
运动
控制策略
四足机器人
计算机装置
算法
策略更新
数据
滤波
处理器
指令
超参数
可读存储介质
系统为您推荐了相关专利信息
检修工具
卷积神经网络模型
分拣方法
视觉系统
梯度下降优化算法