摘要
本发明公开一种基于大语言模型的多智能体强化学习环境自动构建方法及系统,属于人工智能领域。所述方法包括:解析多智能体强化学习环境构建的任务描述,获取所述任务描述中的关键信息和高质量配置示例;基于所述任务描述中的关键信息和高质量配置示例,构建用于生成配置的第一思维链提示词之后,生成任务环境配置信息;将任务环境配置信息转化为任务环境候选配置,并计算任务环境候选配置的配置评分;结合配置评分对任务环境配置信息进行优化;根据所有配置评分,选取任务环境候选配置进行多智能体强化学习环境的构建。本发明可以提高多智能体强化学习任务环境的配置效率,缩短多智能体强化学习在不同任务环境中的适应性和泛化性研究的周期。
技术关键词
环境配置信息
多智能体强化学习
大语言模型
强化学习环境
自动构建方法
生成模板
坐标
地形特征
构建系统
信息检索
列表
模块
规模
格式
代表
算法
标签
场景
周期
系统为您推荐了相关专利信息
客户关系管理系统
机器学习算法
核心业务系统
数据清洗技术
财务管理系统
语义向量
关键点
对齐模块
训练样本集
特征提取模块
大语言模型
机制
数据集构建方法
变量
支持向量机算法
编排方法
卷积长短期记忆
深度强化学习
时序神经网络
策略