摘要
本发明公开了一种双轮足机器人复杂地形自适应运动控制方法及系统,涉及机器人运动控制技术领域。该方法包括步骤:构建包含机器人模型、障碍物和环境约束的复杂地形模型;构建运动决策控制器,利用强化学习模型针对不同的复杂地形模型采用非对称的训练策略对运动决策控制器进行多目标协同优化训练,其中,非对称的训练策略在更新时引入风险约束用于约束策略的行为;根据训练结果进行策略梯度反向传播,使用基于性能反馈的自适应学习率调整方法对非对称的训练策略进行优化。本发明通过在强化学习过程中设计非对称的训练策略和分段训练机制,解决了双轮足机器人在多种复杂地形环境中的高效、鲁棒、自适应的运动控制问题。
技术关键词
运动控制方法
双轮
策略
机器人模型
多源传感器数据融合
强化学习模型
决策
风险
机器人轮子
机器人运动控制技术
机器人基座
表达式
可读存储介质
控制器
评估机器人
网络模块
生成特征向量
运动控制系统
系统为您推荐了相关专利信息
变流器故障
支撑方法
幅值
虚拟阻抗控制策略
电压
螺栓松动检测
复拧方法
实时图像采集
机器人模型
点匹配算法
故障状态识别方法
特征提取模块
轴承滚动体
识别神经网络
堆叠模块
电力交易结算
LightGBM模型
智能化配置方法
专家知识库
策略
三维模型
消防设备
三维激光扫描建模
模型实例化方法
纹理压缩方法