摘要
本发明公开了基于混合强化学习的机器人安全近优运动规划方法,属于机器人运动技术领域。方法包括:初始化机器人初始状态、多层神经网络权重和高阶控制屏障函数HOCBF参数;通过多层神经网络前向传播生成目标导航器;从HOCBF定义的安全控制集筛选安全控制器;融合目标导航器和安全控制器,生成最终控制策略;计算贝尔曼误差;基于最终控制策略和贝尔曼误差,更新机器人初始状态、多层神经网络权重。本发明通过将神经网络逼近的目标导航器与HOCBF安全控制器深度融合,构建具有分层保障架构的混合控制系统。克服了传统CBF在高阶系统中因李导数消失导致的安全保障失效问题,同时突破现有HOCBF方案局限于局部优化的技术瓶颈。
技术关键词
运动规划方法
控制策略
导航器
机器人运动技术
控制器
屏障
混合控制系统
矩阵
系统控制
误差
定义
控制权
网络
分层
鲁棒性
非线性
松弛
参数
瓶颈
系统为您推荐了相关专利信息
电能路由器
能量管理模块
风力发电系统
光伏发电系统
交流供电系统
抗干扰控制方法
雷达系统
抗干扰模式
数字延迟锁相环
抗干扰控制系统
净化控制方法
工业设备
净化设备
协同控制策略
时间预测模型
数码喷墨打印机
数据交换系统
数据流分析技术
数据访问模式
高效数据交换方法