一种空中机器人分层强化学习控制方法

正文

推荐专利

一种空中机器人分层强化学习控制方法

申请号：CN202511383200

申请日期：2025-09-26

公开号：CN120874957A

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及图像识别技术领域，具体为一种空中机器人分层强化学习控制方法，包括建立环境状态模型，根据环境参数将路面标线检测任务分解三个控制层次，分别设置区域级奖励函数、航迹级奖励函数和像素级奖励函数，其中区域级奖励函数评估目标路段覆盖完整性，航迹级奖励函数优化飞行轨迹效率，像素级奖励函数保证图像质量；首先训练环境适应层，确定最优检测区域划分；然后训练路径规划层，生成飞行轨迹；最后训练姿态控制层，实现位置控制；各层之间通过状态信息和奖励信号进行交互；在飞行过程中评估图像质量，当检测到图像模糊度和/或对比度不满足预设阈值时，触发重新拍摄机制和/或调整飞行参数，同时进行分层强化学习模型更新。

技术关键词

分层强化学习空中机器人路面标线检测多维特征向量规划图像评估对比度复杂度轨迹采集环境参数环境状态信息动态权重分配指数卡尔曼滤波算法像素图像识别技术覆盖率