一种基于双向序列推理的多智能体强化学习系统

AITNT
正文
推荐专利
一种基于双向序列推理的多智能体强化学习系统
申请号:CN202510907111
申请日期:2025-07-02
公开号:CN120996072A
公开日期:2025-11-21
类型:发明专利
摘要
本发明公开了一种基于双向序列推理的多智能体强化学习系统,包括数据获取模块、序列推理模块和策略优化模块三部分。首先,在数据获取模块,设计面向BS I‑MARL的智能体状态空间、动作空间以及奖励函数;然后基于Transformer模型,在序列推理模块设计面向双向序列推理的编码器‑解码器模块,用于生成多智能体决策的动作序列;最后在策略优化模块设计面向BS I‑MARL的策略梯度优化方法,评估多智能体的动作选择。本发明系统融合双向推理机制以建模智能体之间的相互影响关系,充分挖掘决策序列中的上下文依赖信息,从而提升非平稳环境下的多智能体学习效率和策略最优性,可应用于多智能体决策任务中。
技术关键词
强化学习系统 数据获取模块 序列 策略 编码器 多层感知器 决策 智能体交互 智能体系统 解码器结构 生成框架 推理机制 解码结构 学习方法 注意力机制 定义 三维结构
系统为您推荐了相关专利信息
1
云原生场景的智能灰度发布决策引擎及风险评估方法
风险评估方法 智能决策引擎 策略 场景 染色
2
面向逻辑运算的光学神经网络训练方法及装置
混合损失函数 神经网络训练方法 对比度 逻辑 误差加权
3
一种纵向联邦学习中基于模型精度预估的参与者选择方法
发布者 特征值编码 联邦学习模型 样本 精度
4
一种电缆线芯温度监测方法
电缆保护层 温度预测模型 电缆线芯温度 阶段 序列
5
一种操作意图识别方法、交互方法及相关装置
意图识别方法 端点 交互方法 对象 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号