摘要
本发明提出了一种基于基底神经节的脉冲神经网络决策模型,包括腹侧纹状体模块、黑质模块、皮层模块和基底神经节模块,皮层模块与基底神经节模块相连接,将环境状态信息传送到基底神经节模块,基底神经节模块进行动作选择和动作序列的学习;腹侧纹状体模块与黑质模块相连接,腹侧纹状体模块接收的当前状态并将计算得到的状态价值传送到黑质模块,黑质模块还接收环境反馈的奖励,计算实际奖励与预期奖励的奖励预测误差,得到TD误差;所述黑质模块分别与腹侧纹状体模块、皮层模块和基底神经节模块相连接,TD误差进一步更新腹侧纹状体模块以及皮层模块和基底神经节模型之间的可塑性突触。本发明提出一种新的皮层‑纹状体突触可塑性更新规则,提高模型应对复杂场景的能力。
技术关键词
黑质
基底
模块
决策
脉冲
多巴胺
环境状态信息
多时间尺度
序列
前额
空间权重矩阵
预测误差
误差反向传播
受体
前馈神经网络
更新方法
传播算法
系统为您推荐了相关专利信息
广告营销系统
社交媒体平台
广告投放策略
关系网络图
PageRank算法
快速识别方法
分辨率
红外光谱特征
特征提取模块
注意力机制
喷墨打印机喷头
数字湿度传感器
压电驱动单元
温湿度
数字温度传感器