基于深度Koopman的机器人强化学习安全控制器在线更新方法

AITNT
正文
推荐专利
基于深度Koopman的机器人强化学习安全控制器在线更新方法
申请号:CN202510276494
申请日期:2025-03-10
公开号:CN120122448B
公开日期:2025-11-25
类型:发明专利
摘要
本发明涉及安全强化学习技术领域,公开了一种基于深度Koopman的机器人强化学习安全控制器在线更新方法,包括:在仿真中采集随机输入控制的轨迹状态,训练深度Koopman神经网络,得到对应提升函数及演化矩阵;采用本征正交分解方法对该模型进行降维处理,获得投影矩阵及新的名义模型;在实机中进行强化学习策略迁移,交互中根据名义模型和当前观测状态得到观测误差,训练在线更新网络,得到残差矩阵;将名义模型与残差模型结合作为模型预测控制的模型约束,得到安全控制输入。本发明可以在线更新安全控制器,提升强化学习安全保障性能,适用于强化学习策略从仿真迁移到实机过程中存在模型差异、物理世界中存在扰动的动态环境等复杂情景。
技术关键词
在线更新方法 强化学习策略 线性 控制器 残差矩阵 预测误差 损失函数优化 方程 重构误差 仿真环境 生成机器人 深度神经网络 观测误差 强化学习技术 序列
系统为您推荐了相关专利信息
1
一种面向ARM架构的对称密码加解密方法及系统
加解密方法 变量 加解密系统 密钥 非线性组件
2
一种基于数据驱动的搅拌摩擦固相增材制造智能控制方法
智能控制方法 多源数据采集系统 加权最小二乘法 数据融合算法 机器学习模型
3
智能牵引控制装置、方法、电子设备及存储介质
智能牵引 长度传感器 绕线盘 信号 力传感器
4
一种机器人触觉传感器数据采集模块及采集方法
机器人触觉传感器 模拟多路复用器 触觉传感单元 数据采集模块 通信单元
5
一种基于GNN和CNN双向结合的CT图像分类模型构建方法
图像分类模型 CT图像数据 医学图像分类技术 标签 特征值
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号