摘要
本发明涉及图像识别技术领域,具体为一种空中机器人分层强化学习控制方法,包括建立环境状态模型,根据环境参数将路面标线检测任务分解三个控制层次,分别设置区域级奖励函数、航迹级奖励函数和像素级奖励函数,其中区域级奖励函数评估目标路段覆盖完整性,航迹级奖励函数优化飞行轨迹效率,像素级奖励函数保证图像质量;首先训练环境适应层,确定最优检测区域划分;然后训练路径规划层,生成飞行轨迹;最后训练姿态控制层,实现位置控制;各层之间通过状态信息和奖励信号进行交互;在飞行过程中评估图像质量,当检测到图像模糊度和/或对比度不满足预设阈值时,触发重新拍摄机制和/或调整飞行参数,同时进行分层强化学习模型更新。
技术关键词
分层强化学习
空中机器人
路面标线检测
多维特征向量
规划
图像评估
对比度
复杂度
轨迹
采集环境参数
环境状态信息
动态权重分配
指数
卡尔曼滤波算法
像素
图像识别技术
覆盖率