摘要
本方案公开了一种集群覆盖搜索模型的训练方法和装置,该方法包括:基于智能体集群所在的环境信息和位置信息集合,构建当前时间步的状态矩阵;将状态矩阵输入初始强化学习模型,通过actor网络预测下一个时间步的行为决策信息;控制各个智能体分别按照移动方向飞行,根据第二位置信息集合确定智能体集群对任务空间的覆盖率;critic网络根据当前时间步、下一时间步的状态矩阵和优势函数计算本次训练的优势值;基于状态矩阵、行为决策信息、优势值计算本次训练的损失值,并根据损失值更新模型。本方案能够确保各智能体能够合理分配任务,避免路径冲突和资源浪费,从而提升系统的整体覆盖效率,实现多目标的平衡和优化。
技术关键词
集群
强化学习模型
网络
矩阵
覆盖率
决策
比率
网格
模块
误差函数
训练装置
提升系统
电子设备
程序
处理器
指令
参数
可读存储介质
存储器
策略
系统为您推荐了相关专利信息
音乐推荐方法
情绪特征
注意力
深度学习模型
滑动窗口
荧光
检测探头
光谱特征参数
紫外LED灯
侦查设备
表面瑕疵检测方法
面饼
瑕疵缺陷检测
表面瑕疵检测系统
图像采集设备
信息综合管理系统
卷积神经网络模型
畜牧养殖场
条目
牲畜
多源异构数据
能源系统
调控策略
调控方法
指示电力设备