摘要
本发明公开了基于多尺度平均场表示方法的智能寻路算法和装置,其方法包括:选取强化学习环境,对环境进行初始化;和环境进行交互并取得反馈数据存入经验回放池;从经验回放池中分批获取环境交互数据对强化学习模型进行训练;定义多尺度平均场表示公式;定义基于多尺度平均场多智能体强化学习的机器人智能寻路过程。本发明显著提升了行为预测的准确性和决策效率。本发明提出了一种强大而灵活的基于多尺度平均场表示方法的智能寻路算法,在多智能体强化学习中展现了优异性能,特别是在大规模复杂环境下,实现了更高效、更精准的智能体行为预测,为多智能体强化学习的发展提供了有力支持。
技术关键词
寻路算法
多尺度
强化学习环境
强化学习模型
注意力机制
引导机器人
数据
邻居
贪心策略
定义
处理器
邻域
可读存储介质
存储器
程序
视野
标志
系统为您推荐了相关专利信息
冲击地压预测方法
搜索算法优化
卷积神经网络特征提取
卷积神经网络提取
引入注意力机制
教学数据分析
节点
多模态特征融合
学习终端
表达式
运输机皮带
跑偏检测方法
托辊
空间金字塔池
直线