摘要
本发明公开了主动感知与规则引导式强化学习的目标导航方法及系统,涉及人工智能技术领域,包括:利用机器人在全局地图上所获取到的环境图像和位置信息构建环境语义地图;在全局探索阶段中,利用启发式的探索规则引导强化学习策略,驱动机器人对环境进行自适应地全局探索,确定粗粒度的目标区域;在末端定位阶段中,利用开放词汇语义检测模型和任意分割模得到目标物体的目标语义检测反馈信息;将目标语义检测反馈信息和环境语义地图输入到末端强化学习模型,利用强化学习策略动态调整机器人位置和朝向;该目标导航方法及系统,显著提升了机器人在开放词汇复杂环境中全局探索效率与末端定位精度,兼顾导航成功率与操作姿态的优化。
技术关键词
强化学习模型
导航方法
检测反馈信息
强化学习策略
语义地图
机器人对环境
特征提取网络
阶段
全局地图
容器
物体
编码环境
置信度阈值
人工智能技术
计算机系统
仿真器
掩膜
系统为您推荐了相关专利信息
运维策略
数据中心运维管理
强化学习模型
智能运维管理设备
环境检测设备
微调方法
自然语言模型
遗传算法
强化学习策略
贪心策略
心理健康评估系统
数据处理模块
数据采集模块
大数据
时间滑动窗口
决策分析系统
策略
知识图谱构建
多轮对话
数据分析模块
网络资源配置
网络迁移方法
性能预测模型
生成方法
强化学习策略