摘要
本申请属于强化学习技术领域。本申请提供一种融合扩散模型与熵调节优化的多巡飞器自主协同规划方法。本公开实施例在离线阶段,利用扩散模型生成高质量的候选协同规划策略。通过熵调节机制优化决策,确保在探索和利用之间取得平衡。通过计算候选协同规划策略的熵值来衡量决策不确定性,并根据熵值变化灵活调整策略探索与执行,以提升作业效率和环境适应性。自适应的熵调节策略反馈给扩散模型,在正向扩散和逆向采样过程中,可以灵活地调整,确保规划策略既具有广泛的探索性,又能在关键任务阶段高效执行。该方法在复杂多变的环境中优化了决策,显著增强了多巡飞器系统的自主协同能力。
技术关键词
协同规划方法
策略
网络
样本
噪声预测模型
强化学习技术
决策
传播算法
参数
高斯混合模型
调节噪声
解码器结构
表达式
误差
因子
仿真环境
协方差矩阵
武器
系统为您推荐了相关专利信息
MEC系统
无线设备
资源分配方法
移动边缘计算技术
空间缩减策略
地址转换
数据平面开发套件
服务器
数据传输方法
BGP邻居
深度神经网络
抽象语法树
识别方法
段落结构
文本