摘要
本发明提供一种基于人机混合的联合决策方法和装置,应用于人工智能技术领域。该方法包括:获取未见队友的可见轨迹信息和智能体可观状态信息;根据所述可见轨迹信息确定历史信息表征向量,根据所述智能体可观状态信息确定可观状态表征;根据所述历史信息表征向量和所述可观状态表征确定未见队友风格信息;将所述未见队友风格信息输入基于人机混合的联合决策网络,得到队友动作;将所述队友动作输入至脉冲神经网络,得到决策动作;其中,所述基于人机混合的联合决策网络通过行列式点过程加以约束,以模拟不同风格的自学习整合。通过人机配合,可以快速接收到队友能力,从而取得更鲁棒泛化的决策结果。
技术关键词
联合决策方法
人机
风格
状态编码器
信息编码器
多尺度
轨迹
非暂态计算机可读存储介质
网络
脉冲
处理器
人工智能技术
计算机程序产品
生物
模块
存储器
电子设备
系统为您推荐了相关专利信息
无人驾驶拖拉机
人机界面控制系统
故障诊断系统
整车控制系统
运动控制系统
无人机回收装置
缓冲控制方法
法兰连接件
泄压阀门
回收控制技术