摘要
本发明公开了一种基于多模态感知的强化学习导航方法及系统,适用于医院、仓储、机场等动态环境。设备通过双目RGB、热成像与毫米波雷达采集环境数据,经跨模态注意力网络融合后,由语义识别模块解析当前场景(候诊区、走廊等),再由PPO策略网络结合语义规则实时生成控制指令。系统支持语音与手势交互,采用轻量化BERT‑Tiny解析语音并加权融合手势目标,λ自适应环境噪声。训练阶段在仿真环境中加入语义区域奖励,使策略在<5万步内收敛,显著优于传统SLAM。硬件由Jetson Xavier边缘单元、麦克风阵列、鱼眼摄像头及安全监控单元构成,实现98.7%动态避障成功率,无需预建地图,具备高灵活性与低训练成本。
技术关键词
自主导航设备
多模态传感器
语义规则
鱼眼摄像头
生成控制指令
手势
控制自主导航
导航系统
麦克风阵列
语音
注意力
消防通道
跨模态
热成像仪
自主导航方法
仿真环境
融合算法
RGB摄像头
系统为您推荐了相关专利信息
语义规则
气象风险预警方法
异常检测器
气象观测数据
物理
地理位置信息
地理实体
协同更新方法
数据编码方式
神经网络权值
智能门禁控制系统
多模态传感器
生理信号采集设备
运动感知设备
数据处理模块
PLC控制模块
液压控制系统
智能汽车
智能控制算法
多传感器
多元时序数据
样本
节点
神经网络建模方法
时间序列特征