摘要
本发明公开了一种智能体人机协作策略的训练系统、方法、设备及介质,该系统包括:队友策略种群生成模块、集中式训练模块和分布式优化模块;队友策略种群生成模块用于根据预设种群数量确定初始策略种群,并对初始策略种群进行协同演化确定目标队友策略种群;集中式训练模块用于根据目标队友策略种群获取全局轨迹信息,并根据全局轨迹信息对全局上下文编码器进行集中式训练;分布式优化模块,用于从全局轨迹信息中确定个体轨迹信息,并根据个体轨迹信息对局部上下文编码器进行优化。基于上述技术方案,显著提升智能体在复杂异质环境中的协作效果,能够与任意多行为风格人类队友进行配合的控制策略,进而提高了智能体在复杂异质环境中的协作效果。
技术关键词
人机协作
轨迹
编码器
训练系统
模块
策略更新
可读存储介质
计算机
聚类算法
电子设备
处理器通信
异质
控制策略
存储器
指令
风格
系统为您推荐了相关专利信息
涂胶机构
视觉检测装置
光电触发装置
视觉控制器
涂胶在线检测方法
扑翼机器人
驱动舵机
尾翼
曲柄摇杆机构
角加速度导数
综合预警方法
综合预警模型
节点
分布式监测
风险
气体检测系统
传感模块
轻量化神经网络
卷积特征提取
环境相对湿度