一种具有优先经验回放的自组织强化学习方法

AITNT

正文

推荐专利

一种具有优先经验回放的自组织强化学习方法

申请号：CN202510553900

申请日期：2025-04-29

公开号：CN120409607A

公开日期：2025-08-01

类型：发明专利

摘要

本申请涉及机器人智能控制技术领域的一种具有优先经验回放的自组织强化学习方法，该方法将深度神经网络(DNN)和自组织学习地图(SOM)相结合，模拟大脑中新皮层与海马体的学习机制进行强化学习，其中深度神经网络(DNN)用于模拟新皮质缓慢学习分布式表征的特性，自组织学习地图(SOM)用于模拟海马体快速学习和模式分离的特性；并采用考虑时间差分(TD)误差、贝尔曼(BE)误差以及经验熟悉度因子指标的优先采样策略来动态调控探索与利用(EET)的平衡。本发明有效地缓解了深度强化学习中数据利用率低以及学习效率差的问题，同时提高了关键经验的采样效率和策略评估的准确性，而且在机器人行为决策中非常有效。

技术关键词

深度神经网络强化学习方法组织地图分布式表征机器人智能控制技术误差深度强化学习贪婪策略并行工作因子动态超参数决策模式机制样本指标

系统为您推荐了相关专利信息

1

一种目标定位方法、装置、设备及存储介质

动态特征提取深度神经网络模型融合特征定位方法三维点云信息

2

基于改进的YOLOv5s模型的智能抽屉物品指引方法

智能抽屉数据库管理系统控制主板麦克风模块图像

3

基于模型预测控制的电路优化方法、系统、装置和介质

电路优化方法仿真数据模型预测控制框架强化学习方法查找表

4

一种二维三角网约束的神经辐射场DSM生成方法

深度神经网络三角形采样点生成方法密度

5

一种智能驾驶多传感器融合数据处理系统

多传感器融合数据处理系统长短期记忆单元模糊逻辑推理决策

添加客服微信openai178，进AITNT官方交流群

驱动智慧未来：提供一站式AI转型解决方案

沪ICP备2023015588号