基于时序同步脉冲记忆策略的智能体强化控制方法

正文

推荐专利

申请号：CN202510184639

申请日期：2025-02-19

公开号：CN120046649A

公开日期：2025-05-27

类型：发明专利

摘要

本发明公开了基于时序同步脉冲记忆策略的智能体强化控制方法，用于解决部分可观测环境下的智能体决策问题：1、构建仿真环境，通过随机掩盖观测维度模拟信息缺失场景；2、搭建策略‑评判强化网络框架，其中脉冲记忆策略网络采用时序同步脉冲编码，通过当前分支处理实时观测、记忆分支整合历史信息，记忆评判网络则评估决策价值；3、采用和任务环境交互得到的数据联合训练强化网络框架；4、部署训练好的网络模型实现智能体控制，通过动作信号执行与奖励反馈评估任务效果。该框架融合脉冲神经元的生物特性与记忆模块的时序建模能力，在部分可观测条件下实现了决策精度提升，相较于传统方法展现出更强的环境适应性与决策鲁棒性。

技术关键词

强化控制方法记忆脉冲强化学习网络分支代表策略时序动态仿真环境场景解码框架参数移动机器人信息编码决策传播算法

系统为您推荐了相关专利信息

基于企业经营数据和业务流程的办理结果路径预测方法

企业经营数据路径预测方法业务流程模型格式化深度优先搜索算法

一种基于二值神经网络的高光谱图像重建系统

图像重建系统二值神经网络参数估计器状态空间模型线性求解器

一种风力发电机组的故障预警及寿命预测方法、系统

多模态数据融合可见光图像寿命预测模型融合特征长短期记忆网络

一种水下网衣作业机器人图像的压缩与解压缩方法及装置

作业机器人高斯概率模型算术编码器解压缩方法图像压缩

基于动态特征筛选与加权集成模型的水稻产地鉴别方法

产地鉴别方法 LightGBM模型矫正方法动态红外光谱鉴别方法

基于时序同步脉冲记忆策略的智能体强化控制方法

站点导航

APP 下载