模拟海马-前额叶记忆规划回放机理的行为决策方法

正文

推荐专利

申请号：CN202510810528

申请日期：2025-06-17

公开号：CN120595808A

公开日期：2025-09-05

类型：发明专利

摘要

本发明涉及人工智能技术领域的模拟海马‑前额叶记忆规划回放机理的行为决策方法，通过构建海马规划回放网络与前额叶策略评估网络的闭环交互，融合元强化学习与基于模型的策略优化技术，仿生神经机制实现动态规划与策略优化的统一，实现类脑决策过程中经验回放与前瞻性模拟的动态耦合，使机器人能够在“规划”中学习。其以无模型元强化学习的方法获取环境基础数据，再利用基于模型元强化学习的策略优化方法，以当前基础数据作为规划的起点，使用模型进行一定步数的规划，并用规划结果来训练模型，克服了现有机器人算法受限于实际环境复杂程度、样本收集困难等问题，有效提升了学习能力，从而满足了移动机器人在多样化复杂场景中的应用需求。

技术关键词

规划决策方法前额策略优化技术强化学习框架记忆单元策略优化方法网络多层注意力机制机器人算法人工智能技术移动机器人闭环动态实时数据

模拟海马-前额叶记忆规划回放机理的行为决策方法

站点导航

APP 下载