一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统

AITNT
正文
推荐专利
一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统
申请号:CN202411867067
申请日期:2024-12-18
公开号:CN119840806B
公开日期:2025-11-21
类型:发明专利
摘要
本发明提出一种基于扩散模型和对抗逆强化学习的无人艇动态避碰决策方法及系统。包括步骤1,收集专家避碰数据;步骤2,训练扩散模型;步骤3,进行数据增强;步骤4,搭建训练环境;步骤5,构建生成器和判别器;步骤6,更新判别器;步骤7,更新生成器;步骤8,完成训练。通过有限专家样本数据训练扩散模型,使用所训练的扩散模型生成额外避碰数据,额外数据与原始专家数据共同参与对抗性逆强化学习的训练过程可以有效解决专家避碰数据受限的难题。并且针对提出算法提供工程应用计划,对本发明提出的算法进行验证,理论与实际相结合形成系统性方案。
技术关键词
避碰决策方法 无人艇 船舶运动模型 主控系统 传播算法 动态 噪声强度 数据分布 SAC算法 神经网络参数 预训练模型 噪声样本 仿真环境 噪声数据 坐标系
系统为您推荐了相关专利信息
1
一种用于介入手术训练的血管模型碰撞力检测方法
血管模型 力检测方法 封闭壳体 数据处理单元 压力传感器
2
一种基于拓展卡尔曼滤波和LSTM的水下管道轨迹预测方法
水下管道 轨迹预测方法 状态空间模型 模型训练算法 离散时间采样
3
预训练模型的参数微调方法、装置、设备及介质
微调方法 预训练模型 矩阵 参数 正交变换
4
一种基于迭代学习的大规模光网络资源分配方法
网络资源分配方法 节点特征 链路 编码 动态更新
5
异常流量检测方法、装置及电子设备
异常流量检测 宽度学习系统 梯度提升模型 网络边缘设备 网络流量数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号