摘要
本发明属于多智能体强化学习中的多智能体合作的领域,具体涉及一种基于异质投资强化学习的多智能体合作方法。为解决多智能体强化学习中经常出现自私个体的现象,本发明加入N人信任博弈来设计智能体的奖励结构,同时为了更加促进合作的产生,使用异质投资的N人信任博弈以鼓励可信任的合作型个体出现并使用超图为智能体关系建模以提取更多特征值,以给予可信任个体更多收益的特点,鼓励智能体合作以成为可信任个体来提高多智能体系统的合作水平。本发明利用实值超图为智能体关系进行建模来提取更深层次的特征信息,同时没有使用同质投资而是使用异质投资以避免自私个体在选择背叛的情况下仍可以获得较多奖励的情况,提高多智能体系统的合作水平。
技术关键词
投资者
多智能体强化学习
多智能体系统
异质
矩阵
全局状态信息
误差函数
人工神经网络
关系建模
判断算法
多层感知机
特征值
信号
顶点
符号
策略
因子
机制