基于通用规划器与强化学习的多任务操控方法

AITNT
正文
推荐专利
基于通用规划器与强化学习的多任务操控方法
申请号:CN202411884182
申请日期:2024-12-20
公开号:CN119337964B
公开日期:2025-04-15
类型:发明专利
摘要
本发明公开一种基于通用规划器与强化学习的多任务操控方法,采集单任务场景的轨迹数据,并通过优先级轨迹回放选择高优先级样本;利用选定样本,最小化相邻状态差异来训练通用规划器,期望获取两个状态及一个动作作为确定条件下的可达性信息,即所需要的步数距离;通过将规划器输出的步数距离最小化作为目标来训练动作网络以获取两状态间的最优动作,再结合到强化学习策略网络中对其进行指导,以优化动作选择,并逐步减少指导,最后通过共享多任务样本强化学习得到的策略网络,在多任务环境中实现高效学习。采用本发明方法,能够有效应对不同任务之间的策略冲突,提升策略的稳定性与泛化能力,实现多任务环境中的高效操控。
技术关键词
强化学习策略 操控方法 多任务 规划 网络 轨迹 样本 SAC算法 最小化误差 表达式 场景 多层感知机 因子 决策 批量 代表 广义 度量 效应
系统为您推荐了相关专利信息
1
隔离开关操作安全性智能监测方法及系统
隔离开关 智能监测方法 应力 影像捕捉设备 空间分布特征
2
一种辅助铁塔攀爬的助力方法及装置
关节 助力方法 铁塔 足底压力信号 双层优化模型
3
智慧井盖防偷盗监测系统
智慧井盖 监测系统 检测井盖 神经网络模型构建 标记
4
基于5G的VR游戏多用户交互系统及方法
触摸板表面 伸缩机构 多用户交互方法 控制模块 通信模块
5
数据处理方法、装置、设备及可读存储介质
终端设备 分类网络 预训练模型 参数 编码
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号