基于元强化学习的多智能体协作方法、装置、设备及介质

正文

推荐专利

申请号：CN202511202465

申请日期：2025-08-26

公开号：CN120975121A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于医疗健康及金融科技等业务系统平台中，公开了一种基于元强化学习的多智能体协作方法，包括:根据获取的多源信息数据构建任务特征向量；根据任务特征向量计算新任务与训练任务的任务差异度；通过任务差异度构建元训练模型；根据采样任务对元训练模型进行双循环训练，得到最优元参数；将最优元参数作为新任务的初始参数，根据初始参数更新新任务与训练任务的任务差异度，根据更新后的任务差异度确定微调学习率，利用微调学习率对元训练模型进行微调处理；获取预设时间的环境数据，并将环境数据输入微调处理后的元训练模型中，得到动作分布概率，根据动作分布概率确定具体动作，并使多智能体执行具体动作。

技术关键词

协作方法多源信息数据协作程序参数双循环协作装置时序特征长短期记忆网络计算机设备人工智能技术生成动作医疗健康处理器业务系统模块可读存储介质存储器策略

基于元强化学习的多智能体协作方法、装置、设备及介质

站点导航

APP 下载