复杂动态环境下基于强化学习的机器人自主导航的模型训练方法

AITNT
正文
推荐专利
复杂动态环境下基于强化学习的机器人自主导航的模型训练方法
申请号:CN202511063822
申请日期:2025-07-31
公开号:CN120558244B
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了一种复杂动态环境的基于强化学习的机器人自主导航方法,涉及强化学习、机器人导航等技术领域。本发明旨在解决多目标强化学习中,目标之间存在冲突,导致导航策略难以动态权衡、决策灵活性不足的问题。首先,创建仿真环境并构建Bayesian‑RVO模型用于对仿真环境中的行人行为模拟;其次,引入博弈论中的均衡响应原理设计奖励函数并构建博弈论框架;然后,设计基于Stackelberg博弈结构的双层决策网络;在此基础上,引入BNN结构的Critic网络;最后,进行模型训练。与现有方法相比,本发明在复杂环境下表现出更高的导航成功率、更低的碰撞率和更强的路径合理性,显著提升了机器人在复杂环境中的自主导航性能,可应用于农业、工业、服务业等领域。
技术关键词
机器人自主导航 模型训练方法 网络 障碍物 社交 仿真环境 速度 策略 生成机器人 概率密度函数 Actor模型 决策 仿真软件 动态 框架 高斯混合模型 模拟行人 参数
系统为您推荐了相关专利信息
1
一种基于IT负载预测的动态空调调节方法及系统
空调调节方法 负载预测特征 动态调节控制 指数特征 支持向量机模型
2
芯片光刻图形优化的深度学习方法、装置及设备
光刻图形 光刻工艺 拓扑特征 深度学习方法 卷积网络模型
3
虚拟场景的交互方法、装置、介质、设备以及产品
生成对抗网络 场景 虚拟现实设备 扫描装置 图像风格迁移技术
4
一种基于水生态环境的异常监控与分析方法及系统
溯源数据 网络节点 温湿度 传感器单元 云服务器
5
晶圆参数预测模型的训练方法与晶圆参数的预测方法
晶圆 网格 参数 分辨率 网络模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号