一种基于因果推理和分层注意力机制的强化学习方法

正文

推荐专利

申请号：CN202511092483

申请日期：2025-08-05

公开号：CN120975174A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及多智能体强化学习领域，其公开了一种基于因果推理和分层注意力机制的强化学习方法，弥补传统多智能体系统中角色分配不准确和协作效率低下的缺陷，提升整体协作性能。该方法通过构建因果感知的多智能体协作模型，首先利用结构因果模型构建动态因果图，利用优化变分分布估计器计算智能体间的因果影响力向量；然后基于因果影响力向量生成因果引导的分层注意力权重；接着通过跨智能体注意力共享机制实现协作信息传递，利用跨层融合机制生成增强特征表示；进一步基于全局因果贡献度和局部因果贡献度设计因果感知角色选择器，实现智能体角色的动态分配；最后通过因果影响内在奖励机制进行模型训练优化。

技术关键词

分层注意力强化学习方法多智能体系统层级机制加权特征门控循环单元协作模型动态多智能体强化学习多智能体协作参数协作信息梯度下降法生成智能多层感知机时序编码器强度

系统为您推荐了相关专利信息

基于双向注意力的药物分子属性预测方法及系统

分子属性预测方法属性预测模型关系网络分子结构信息节点

结合多重采样与跨域匹配的路侧多激光雷达点云拼接方法

激光雷达点云拼接方法 ICP算法点云配准算法点云密度

一种基于知识星图增强大语言模型的化工安全运维方法、设备、介质及产品

实体大语言模型运维方法关键词化工

一种电学性能测试平台及方法

电学性能测试方法短时傅立叶变换性能测试平台电路时间变化特征

一种自适应信道接入方法

信道接入方法 LSTM模型免授权频段信道状态信息值脉冲特征

一种基于因果推理和分层注意力机制的强化学习方法

站点导航

APP 下载