摘要
本发明提出一种基于检索增强机制的路径覆盖方法,该方法包括:获取预先收集的数据集,基于Decision Transformer架构构建策略模型,将机器人视为一个智能体,利用策略模型预测智能体的动作分布,得到策略模型在当前时刻预测的动作分布,基于预先收集的数据集,将输入轨迹依次经过FH机制与预训练语言模型处理,以得到键值对集合,基于当前输入子轨迹从键值对集合中检索出相似子轨迹,得到检索到的相似子轨迹的集合。本发明通过引入外部记忆库,添加相似轨迹检索机制,在训练模型初期快速构建路径规划策略,有效降低冗余的覆盖路径规划的效果,使训练消耗的计算资源明显降低,提高模型在稀疏奖励环境中的决策能力。
技术关键词
轨迹
键值
预训练语言模型
机制
强化学习策略
记忆
数据
机器人
序列
阶段
索引
规划
矩阵
冗余
决策
因子
系统为您推荐了相关专利信息
智能机器人
工件轮廓
机器人自主导航
位置更新
路径规划单元
高铁接触网部件
检测网络模型
脱落方法
原始图像数据
风险评估模型
构建知识图谱
学术资源推荐方法
实体
关系抽取技术
注意力机制