一种基于扩散模型和反馈学习的人机混合编队智能决策生成方法

正文

推荐专利

申请号：CN202410812924

申请日期：2024-06-23

公开号：CN118838164A

公开日期：2024-10-25

类型：发明专利

摘要

本发明涉及一种基于扩散模型和反馈学习的人机混合编队智能决策生成方法，通过建立训练场景和多智能体样本生成机制，采用扩散模型生成大量训练样本，从而获得有效观测样本；采用改进的反馈学习算法，实现策略的监督寻优，解决由于训练样本的随机波动导致的训练过程中可能出现的局部决策优化；基于扩散模型探索策略样本，对人机混合编队博弈策略实现智能生成，比现有方法所采用的强化学习策略训练生成具有更强的适应能力和泛化能力，同时本发明采用反馈学习，对初始扩散得到的策略进行监督优化和更新，克服了现有方法探索效率低，收敛慢，策略价值信息利用不足的缺点，提高了人机混合编队博弈胜率。

技术关键词

人机混合编队决策生成方法混合网络轨迹仿真环境梯度下降算法偏好计算方法智能体神经网络样本缓冲池智能算法控制注意力强化学习策略阶段更新网络参数救援机器人

系统为您推荐了相关专利信息

一种差速驱动转向的农机自动导航控制方法

农机坐标系表达式电机驱动器动力电机

一种图像识别人体姿态控制皮影的交互系统

人体姿态控制交互系统皮影装置神经网络架构图像识别算法

一种基于远程控制的钻孔设备三维轨迹定位方法

轨迹定位方法钻孔设备测量点钻孔路径激光扫描仪

一种基于RRT和专家遗传算法的无人机路径规划方法和系统

轨迹优化方法粒子狼群算法遗传算法求解多无人机

一种用于汽缸盖的旋转装置

旋转装置定位缓冲装置汽缸盖工作台表面旋转架

一种基于扩散模型和反馈学习的人机混合编队智能决策生成方法

站点导航

APP 下载