摘要
本发明公开了基于时序同步脉冲记忆策略的智能体强化控制方法,用于解决部分可观测环境下的智能体决策问题:1、构建仿真环境,通过随机掩盖观测维度模拟信息缺失场景;2、搭建策略‑评判强化网络框架,其中脉冲记忆策略网络采用时序同步脉冲编码,通过当前分支处理实时观测、记忆分支整合历史信息,记忆评判网络则评估决策价值;3、采用和任务环境交互得到的数据联合训练强化网络框架;4、部署训练好的网络模型实现智能体控制,通过动作信号执行与奖励反馈评估任务效果。该框架融合脉冲神经元的生物特性与记忆模块的时序建模能力,在部分可观测条件下实现了决策精度提升,相较于传统方法展现出更强的环境适应性与决策鲁棒性。
技术关键词
强化控制方法
记忆
脉冲
强化学习网络
分支
代表
策略
时序
动态
仿真环境
场景
解码
框架
参数
移动机器人
信息编码
决策
传播算法
系统为您推荐了相关专利信息
企业经营数据
路径预测方法
业务流程模型
格式化
深度优先搜索算法
图像重建系统
二值神经网络
参数估计器
状态空间模型
线性求解器
多模态数据融合
可见光图像
寿命预测模型
融合特征
长短期记忆网络
作业机器人
高斯概率模型
算术编码器
解压缩方法
图像压缩
产地鉴别方法
LightGBM模型
矫正方法
动态
红外光谱鉴别方法