一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统

正文

推荐专利

申请号：CN202411867067

申请日期：2024-12-18

公开号：CN119840806B

公开日期：2025-11-21

类型：发明专利

摘要

本发明提出一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统。包括步骤1，收集专家避碰数据；步骤2，训练扩散模型；步骤3，进行数据增强；步骤4，搭建训练环境；步骤5，构建生成器和判别器；步骤6，更新判别器；步骤7，更新生成器；步骤8，完成训练。通过有限专家样本数据训练扩散模型，使用所训练的扩散模型生成额外避碰数据，额外数据与原始专家数据共同参与对抗性逆强化学习的训练过程可以有效解决专家避碰数据受限的难题。并且针对提出算法提供工程应用计划，对本发明提出的算法进行验证，理论与实际相结合形成系统性方案。

技术关键词

避碰决策方法无人艇船舶运动模型主控系统传播算法动态噪声强度数据分布 SAC算法神经网络参数预训练模型噪声样本仿真环境噪声数据坐标系

系统为您推荐了相关专利信息

一种用于介入手术训练的血管模型碰撞力检测方法

血管模型力检测方法封闭壳体数据处理单元压力传感器

一种基于拓展卡尔曼滤波和LSTM的水下管道轨迹预测方法

水下管道轨迹预测方法状态空间模型模型训练算法离散时间采样

预训练模型的参数微调方法、装置、设备及介质

微调方法预训练模型矩阵参数正交变换

一种基于迭代学习的大规模光网络资源分配方法

网络资源分配方法节点特征链路编码动态更新

异常流量检测方法、装置及电子设备

异常流量检测宽度学习系统梯度提升模型网络边缘设备网络流量数据

一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统

站点导航

APP 下载