基于迁移强化学习的机器人避障方法和装置

正文

推荐专利

基于迁移强化学习的机器人避障方法和装置

申请号：CN202510450984

申请日期：2025-04-11

公开号：CN120370932A

公开日期：2025-07-25

类型：发明专利

摘要

本申请实施例提供一种基于迁移强化学习的机器人避障方法和装置。应用于机器人避障控制技术领域，该方法通过获取目标域数据集，对数据集进行预处理后输入至训练好的Transformer模型，通过Transformer模型输出新的数据样本；将原始数据样本和新的数据样本进行混合，得到目标域合成数据集；采用条件变分自编码器根据目标域合成数据集进行目标域数据分布建模，确定目标域上数据的状态转移概率；利用双二元分类器架构根据机器人状态动作的实时交互数据确定源域上数据的状态转移概率；基于目标域的状态转移概率和源域的状态转移概率，对源域上训练的机器人避障策略进行迁移，减少了训练过程中的成本损耗，增加了避障策略的环境适应性。

技术关键词

机器人避障方法计算机执行指令分类器数据分布编码器机器人避障装置样本计算机存储介质轨迹策略模块计算机程序产品处理器存储器网络解码器代表

系统为您推荐了相关专利信息

一种双重要性驱动的语义通信方法、系统、设备及存储介质

消息联合信源信道编码分析模块神经网络参数差错保护

基于图注意力机制与自监督学习的多维度谣言检测方法

谣言检测方法注意力机制监督学习模型分类器矩阵

衬底搬送装置及具备所述衬底搬送装置的衬底处理装置

衬底搬送装置触觉传感器外周面作用力检测器

一种基于自编码器的钻井数据传输方法

数据传输方法编码器数据压缩解码器钻井钻头位置

基于多期相特征对齐融合模型的结直肠癌自动分割方法及装置

自动分割方法直肠癌注意力机制静脉瓶颈结构

基于迁移强化学习的机器人避障方法和装置

站点导航

APP 下载