摘要
本申请公开了一种协同建模的协同者拟合方法及系统,涉及协同决策、人工智能技术,包括:获取协同者的行为轨迹信息;利用风格表征网络,基于所述行为轨迹信息对队友的认知风格进行建模,输出所述协同者的风格表征向量;将输出的风格表征向量,发送至多风格策略建模网络,其中在多风格策略建模网络,预先通过模仿学习和行为克隆,优化训练有多个基础风格策略模型;利用所述多风格策略建模网络,计算当前状态下每个基础风格策略的动作概率分布;从动作概率分布中选取概率最高的动作作为预测动作、输出。本申请的方法能够有效克服现有方法泛化能力不足、计算成本高、缺乏个性化和解释性等关键缺陷,显著提升智能体在开放团队协作场景中的实际表现。
技术关键词
风格
策略
网络
生成编码数据
轨迹
协作场景
元素
拟合系统
基础
人工智能技术
决策
离线
度量
存储器
处理器
矩阵
定义
团队
索引
模块
系统为您推荐了相关专利信息
信息验证方法
信息处理模型
信息验证装置
拍摄设备
信息处理模块