复杂动态环境下基于强化学习的机器人自主导航的模型训练方法

正文

推荐专利

申请号：CN202511063822

申请日期：2025-07-31

公开号：CN120558244B

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了一种复杂动态环境的基于强化学习的机器人自主导航方法，涉及强化学习、机器人导航等技术领域。本发明旨在解决多目标强化学习中，目标之间存在冲突，导致导航策略难以动态权衡、决策灵活性不足的问题。首先，创建仿真环境并构建Bayesian‑RVO模型用于对仿真环境中的行人行为模拟；其次，引入博弈论中的均衡响应原理设计奖励函数并构建博弈论框架；然后，设计基于Stackelberg博弈结构的双层决策网络；在此基础上，引入BNN结构的Critic网络；最后，进行模型训练。与现有方法相比，本发明在复杂环境下表现出更高的导航成功率、更低的碰撞率和更强的路径合理性，显著提升了机器人在复杂环境中的自主导航性能，可应用于农业、工业、服务业等领域。

技术关键词

机器人自主导航模型训练方法网络障碍物社交仿真环境速度策略生成机器人概率密度函数 Actor模型决策仿真软件动态框架高斯混合模型模拟行人参数

系统为您推荐了相关专利信息

一种基于IT负载预测的动态空调调节方法及系统

空调调节方法负载预测特征动态调节控制指数特征支持向量机模型

芯片光刻图形优化的深度学习方法、装置及设备

光刻图形光刻工艺拓扑特征深度学习方法卷积网络模型

虚拟场景的交互方法、装置、介质、设备以及产品

生成对抗网络场景虚拟现实设备扫描装置图像风格迁移技术

一种基于水生态环境的异常监控与分析方法及系统

溯源数据网络节点温湿度传感器单元云服务器

晶圆参数预测模型的训练方法与晶圆参数的预测方法

晶圆网格参数分辨率网络模块

复杂动态环境下基于强化学习的机器人自主导航的模型训练方法

站点导航

APP 下载