基于增量强化学习的机器人安全训练方法、装置和设备

正文

推荐专利

申请号：CN202411959019

申请日期：2024-12-30

公开号：CN119376261B

公开日期：2025-04-11

类型：发明专利

摘要

本申请涉及一种基于增量强化学习的机器人安全训练方法、装置和设备。所述方法包括：采用历史数据对机器人的非线性系统中未知模型信息进行估计，基于线性增量系统构建增广增量系统，并且构建惩罚函数表征机器人完成任务的需求，根据第k步之后的惩罚函数，得到用于评估机器人性能的值函数；根据值函数，构建Q‑函数，利用预先构建的模型引导增量强化学习算法在线迭代求解Q‑函数，得到最优控制策略和最优误差估计策略，以及机器人模型，并利用在线学习到的机器人模型进行前向预测促进强化学习在线训练，基于在线学习到的机器人模型，构建二次型约束优化对机器人最优控制策略进行微调，以此实现在线安全学习。采用本方法能够实现机器人安全训练。

技术关键词

机器人模型评估机器人强化学习算法在线非线性系统矩阵估计误差控制策略表达式训练装置计算机设备模块存储器处理器障碍物

系统为您推荐了相关专利信息

基于多模态数据融合的健康监测与疼痛评估系统及方法

多模态数据融合疼痛评估系统疼痛评估方法健康监测数据多尺度卷积神经网络

一种基于LSTM的锂离子电池SOC估计方法

SOC估计方法锂离子电池鲸鱼优化算法等效电路模型 Thevenin模型

一种用于电阻点焊的焊点拉剪力预测模型的建立方法

动态电阻曲线 XGBoost算法焊点 XGBoost模型搜索算法

私域流量监测分析处理方法及系统

深度强化学习算法客户活动触发列表深度Q网络

一种变压器油中气体在线监测预警方法及系统

气体在线监测多层LSTM模型预警方法预警模型气体检测传感器

基于增量强化学习的机器人安全训练方法、装置和设备

站点导航

APP 下载