摘要
本发明公开了一种基于上下文感知与模仿学习的目标驱动导航方法及装置,基于目标检测器DETR,识别图像中感兴趣的物体实例,构建物体图。基于上下文感知图推理,在导航过程中以图像、动作和记忆等动态上下文信息为指导,在每个时间步借助TransH方法将物体特征投影到相应上下文的超平面上,动态学习物体关系,使智能体更好地理解复杂环境。基于Transformer的视觉表示,融合视觉特征和图特征,更好地捕捉环境的空间语义信息。基于生成对抗模仿学习,设计新的动态奖励函数,结合环境奖励,帮助智能体避免死锁状态。基于标准的异步优势演员‑评论家算法,利用新的奖励函数训练有效的导航策略,提升智能体在陌生环境中的导航成功率和效率。
技术关键词
物体
导航方法
多头注意力机制
关系
残差神经网络
动态上下文信息
融合视觉特征
图像全局特征
动态地
长短期记忆网络
感兴趣
策略
前馈神经网络
检测器
编码器模块
系统为您推荐了相关专利信息
零件残余应力
路径规划方法
残余应力测试
刚度
残余应力场
视频帧集合
视频分析方法
语义
生成答案
处理单元
数据处理方法
数据关联关系
字段
建立映射关系
数据接口