多目标进化算法辅助的多智能体强化学习的机器人行走控制方法

正文

推荐专利

申请号：CN202411625348

申请日期：2024-11-14

公开号：CN119472681A

公开日期：2025-02-18

类型：发明专利

摘要

本发明公开了一种多目标进化算法辅助的多智能体强化学习的机器人行走控制方法，包括：1.建立多智能体强化学习框架中的行动者网络actor和批评家网络critic；2.将机器人的所有行走策略建立成种群，使用集中式策略扩展价值函数近似器来拟合种群个体的值，并计算其损失函数；4.使用策略新颖度和强化学习奖励值作为种群个体的双目标函数并计算相应值；5.使用多目标进化算法进行非支配排序，得到帕累托解集，筛选精英个体并进行交叉产生子代以得到最佳策略。本发明能解决机器人行走不平稳的问题，在一定的训练时间内，探索出更多行走策略来调整机器人的速度和动作，从而能使机器人的关节相互配合，平稳地进行行走。使最终机器人进行平稳地行走。

技术关键词

策略进化算法控制机器人行走多智能体强化学习多智能体协作网络可读存储介质代表排序算法处理器团队存储器矩阵多任务计算机定义电子设备程序

系统为您推荐了相关专利信息

基于ML的后副车架结构轻量化与模态优化的目标设计方法

后副车架机器学习模型仿真模型进化策略参数

图像实例分割与语义分割任务联合优化方法、设备及介质

实例分割联合优化方法语义校正算法图像

融合深度学习的汽轮机振动故障诊断系统

振动故障诊断系统融合深度学习模块异构特征数据同步

基于多智能体的无人机集群两阶段协同多目标探测方法

无人机集群原始观测数据两阶段虚拟仿真环境注意力机制

智能售票机紧急情况响应与安全防护系统

售票机安全监控模块防护系统数据分析模块风险评估模型

多目标进化算法辅助的多智能体强化学习的机器人行走控制方法

站点导航

APP 下载