基于深度Koopman的机器人强化学习安全控制器在线更新方法

正文

推荐专利

申请号：CN202510276494

申请日期：2025-03-10

公开号：CN120122448B

公开日期：2025-11-25

类型：发明专利

摘要

本发明涉及安全强化学习技术领域，公开了一种基于深度Koopman的机器人强化学习安全控制器在线更新方法，包括：在仿真中采集随机输入控制的轨迹状态，训练深度Koopman神经网络，得到对应提升函数及演化矩阵；采用本征正交分解方法对该模型进行降维处理，获得投影矩阵及新的名义模型；在实机中进行强化学习策略迁移，交互中根据名义模型和当前观测状态得到观测误差，训练在线更新网络，得到残差矩阵；将名义模型与残差模型结合作为模型预测控制的模型约束，得到安全控制输入。本发明可以在线更新安全控制器，提升强化学习安全保障性能，适用于强化学习策略从仿真迁移到实机过程中存在模型差异、物理世界中存在扰动的动态环境等复杂情景。

技术关键词

在线更新方法强化学习策略线性控制器残差矩阵预测误差损失函数优化方程重构误差仿真环境生成机器人深度神经网络观测误差强化学习技术序列

系统为您推荐了相关专利信息

一种面向ARM架构的对称密码加解密方法及系统

加解密方法变量加解密系统密钥非线性组件

一种基于数据驱动的搅拌摩擦固相增材制造智能控制方法

智能控制方法多源数据采集系统加权最小二乘法数据融合算法机器学习模型

智能牵引控制装置、方法、电子设备及存储介质

智能牵引长度传感器绕线盘信号力传感器

一种机器人触觉传感器数据采集模块及采集方法

机器人触觉传感器模拟多路复用器触觉传感单元数据采集模块通信单元

一种基于GNN和CNN双向结合的CT图像分类模型构建方法

图像分类模型 CT图像数据医学图像分类技术标签特征值

基于深度Koopman的机器人强化学习安全控制器在线更新方法

站点导航

APP 下载