摘要
本发明提出一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统。包括步骤1,收集专家避碰数据;步骤2,训练扩散模型;步骤3,进行数据增强;步骤4,搭建训练环境;步骤5,构建生成器和判别器;步骤6,更新判别器;步骤7,更新生成器;步骤8,完成训练。通过有限专家样本数据训练扩散模型,使用所训练的扩散模型生成额外避碰数据,额外数据与原始专家数据共同参与对抗性逆强化学习的训练过程可以有效解决专家避碰数据受限的难题。并且针对提出算法提供工程应用计划,对本发明提出的算法进行验证,理论与实际相结合形成系统性方案。
技术关键词
避碰决策方法
无人艇
船舶运动模型
主控系统
传播算法
动态
噪声强度
数据分布
SAC算法
神经网络参数
预训练模型
噪声样本
仿真环境
噪声数据
坐标系
系统为您推荐了相关专利信息
血管模型
力检测方法
封闭壳体
数据处理单元
压力传感器
水下管道
轨迹预测方法
状态空间模型
模型训练算法
离散时间采样
异常流量检测
宽度学习系统
梯度提升模型
网络边缘设备
网络流量数据