摘要
本申请属于机器人智能控制技术领域,涉及模拟大脑学习与记忆机理的机器人行为决策方法及设备。其方法是将发育网络DN2、强化学习以及自组织地图SOM相结合,模拟小脑学习系统、基底神经节和海马体学习系统的功能,得到基于发育网络DN2的自组织强化学习模型;其设备包括:一个或多个处理器及存储有一个或多个计算机可读指令的计算机可读介质,用于实现上述机器人行为决策方法。本发明恰当地利用了小脑学习系统、基底神经节和海马体学习系统三者的功能,这种融合算法结合强化学习和监督学习方法,既增强了基于发育网络DN2的自组织强化学习模型的鲁棒性,又提高了算法获得有效避障策略的能力,可以帮助智能体快速学习到高效的解。
技术关键词
学习系统
强化学习模型
决策方法
计算机可读指令
网络
基底
组织
监督学习功能
记忆
监督学习方法
时序
邻域
辅助机器人
误差
地图
处理器
融合算法
系统为您推荐了相关专利信息
遥感图像去雾方法
大气散射模型
有雾图像
去雾模型
多维度特征提取
云计算资源池
动态调度方法
记忆单元
长短期记忆网络
资源分配
资源预测方法
注意力
长短期记忆网络
时间序列分解方法
LSTM模型