摘要
本发明公开了复杂场景下基于AI强化学习的智能追踪系统、方法及机器人,系统包括:POMDP环境建模模块、递归策略网络模块、MDP决策执行模块;所述POMDP环境建模模块,用于预设目标的状态空间、动作空间及观测空间,输出状态转移概率及观测概率矩阵;所述递归策略网络模块,用于处理历史观测序列,输出多梯度策略;所述MDP决策执行模块,用于将POMDP的置信状态软映射为MDP状态,通过Boltzmann探索与双Q‑learning更新生成实时动作指令,实现目标的智能追踪。本发明通过协同优化环境建模与实时决策能力,显著提升目标追踪系统在动态复杂场景下的性能。
技术关键词
智能追踪系统
智能追踪方法
网络模块
激光雷达点云
时间卷积网络
场景
传感器融合
分支
策略更新
追踪机器人
时序特征
决策
编码模块
离散化方法
多尺度
系统为您推荐了相关专利信息
冗余检测方法
电池外壳
铝制
网络模块
图像采集装置
局部路径规划
激光雷达点云
融合视觉
路径规划算法
语义点云
电磁频谱监测系统
智能分析引擎
传感器模块
机器学习模型
网络模块
在线标定方法
自然场景
相机外参
语义分割算法
激光雷达点云
时间卷积网络
卷积模型
功率调节方法
策略
激光发射器