摘要
本申请公开了一种基于深度RNN的人机交互似然值评估方法、设备及介质,涉及人机混合智能技术领域,该方法包括获取机器人在自主导航运动时的环境深度图像;将环境深度图像输入至动作价值估计网络模块,得到动作价值估计;将环境深度图像输入至交互似然值估计网络模块,得到环境状态隐藏特征向量;将动作价值估计输入至交互似然值估计网络模块,得到动作价值估计隐藏特征向量;将环境状态隐藏特征向量和动作价值估计隐藏特征向量输入至人机交互似然估计模块,得到机器人的交互似然估计值,根据各机器人的交互似然估计值,对估计值最大的机器人进行选择。本申请能够对动态复杂环境中的多机器人系统进行主动选择。
技术关键词
网络模块
环境感知数据
门控循环单元
人机混合智能
图像
时序
机器人系统
运动
处理器
计算机设备
节点
参数
可读存储介质
存储器
矩阵