基于两阶段解耦离线强化学习的机器人路径规划模型及方法

正文

推荐专利

申请号：CN202411100707

申请日期：2024-08-12

公开号：CN119148702A

公开日期：2024-12-17

类型：发明专利

摘要

本发明公开了一种基于两阶段解耦离线强化学习的机器人路径规划模型及方法，属于机器智能决策与控制技术领域。该方法包括一种基于两阶段解耦离线强化学习的神经网络模型，该模型利用Transformer架构避免传统基于策略约束方法和基于值函数正则方法存在的分布外泛化问题，并修改现有的基于Transformer架构强化学习方法，使预测状态与预测动作两阶段解耦，令智能体不局限于模仿数据集中轨迹与动作组合，而是能够学习到具有高期望回报的状态，通过拼接次优轨迹和状态组合实现超越数据集中最优轨迹的行为策略。该方法旨在解决现有机器人路径规划方法计算资源需求高，模型泛化能力差，模型应对不确定性和容易陷入局部最优等问题。

技术关键词

机器人路径规划两阶段离线机器智能决策高性能机器人强化学习方法路径规划算法构建训练集超参数约束方法梯度方法数据神经网络模型注意力轨迹控制策略

系统为您推荐了相关专利信息

无刷双馈变频调速系统控制参数离线辨识与在线优化方法

在线优化方法无刷双馈电机系统控制参数定子变频调速系统

一种基于双流特征融合的低剂量CT图像去噪方法

低剂量CT图像 CT图像去噪图像去噪模型生成对抗网络编码器

一种基于离线强化学习的暖通空调节能优化控制方法及系统

暖通空调节能强化学习模型优化控制方法暖通空调系统阀门开度控制

基于多模态数据与在线学习驱动的飞行员操纵能力评估方法及系统

能力评估模型滑动窗口机制能力评估方法多模态离线

用于地图更新的数据处理方法和装置

更新地图数据地图更新巡检数据数据处理方法关键帧

基于两阶段解耦离线强化学习的机器人路径规划模型及方法

站点导航

APP 下载