基于通用规划器与强化学习的多任务操控方法

正文

推荐专利

申请号：CN202411884182

申请日期：2024-12-20

公开号：CN119337964B

公开日期：2025-04-15

类型：发明专利

摘要

本发明公开一种基于通用规划器与强化学习的多任务操控方法，采集单任务场景的轨迹数据，并通过优先级轨迹回放选择高优先级样本；利用选定样本，最小化相邻状态差异来训练通用规划器，期望获取两个状态及一个动作作为确定条件下的可达性信息，即所需要的步数距离；通过将规划器输出的步数距离最小化作为目标来训练动作网络以获取两状态间的最优动作，再结合到强化学习策略网络中对其进行指导，以优化动作选择，并逐步减少指导，最后通过共享多任务样本强化学习得到的策略网络，在多任务环境中实现高效学习。采用本发明方法，能够有效应对不同任务之间的策略冲突，提升策略的稳定性与泛化能力，实现多任务环境中的高效操控。

技术关键词

强化学习策略操控方法多任务规划网络轨迹样本 SAC算法最小化误差表达式场景多层感知机因子决策批量代表广义度量效应

系统为您推荐了相关专利信息

隔离开关操作安全性智能监测方法及系统

隔离开关智能监测方法应力影像捕捉设备空间分布特征

一种辅助铁塔攀爬的助力方法及装置

关节助力方法铁塔足底压力信号双层优化模型

智慧井盖防偷盗监测系统

智慧井盖监测系统检测井盖神经网络模型构建标记

基于5G的VR游戏多用户交互系统及方法

触摸板表面伸缩机构多用户交互方法控制模块通信模块

数据处理方法、装置、设备及可读存储介质

终端设备分类网络预训练模型参数编码

基于通用规划器与强化学习的多任务操控方法

站点导航

APP 下载