基于大语言模型的多智能体强化学习环境自动构建方法及系统

正文

推荐专利

申请号：CN202510462927

申请日期：2025-04-14

公开号：CN120542595A

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开一种基于大语言模型的多智能体强化学习环境自动构建方法及系统，属于人工智能领域。所述方法包括：解析多智能体强化学习环境构建的任务描述，获取所述任务描述中的关键信息和高质量配置示例；基于所述任务描述中的关键信息和高质量配置示例，构建用于生成配置的第一思维链提示词之后，生成任务环境配置信息；将任务环境配置信息转化为任务环境候选配置，并计算任务环境候选配置的配置评分；结合配置评分对任务环境配置信息进行优化；根据所有配置评分，选取任务环境候选配置进行多智能体强化学习环境的构建。本发明可以提高多智能体强化学习任务环境的配置效率，缩短多智能体强化学习在不同任务环境中的适应性和泛化性研究的周期。

技术关键词

环境配置信息多智能体强化学习大语言模型强化学习环境自动构建方法生成模板坐标地形特征构建系统信息检索列表模块规模格式代表算法标签场景周期

系统为您推荐了相关专利信息

一种基于绩效模型的银行客户经理积分处理方法及系统

客户关系管理系统机器学习算法核心业务系统数据清洗技术财务管理系统

一种基于双曲空间视觉与语言对齐的果蝇行为识别方法

语义向量关键点对齐模块训练样本集特征提取模块

学习TrainDLenGap的隐式机制协助大语言模型开发的方法及系统

大语言模型机制数据集构建方法变量支持向量机算法

基于大模型感知的多样化司法指令数据选择方法及系统

标签指令数据标记索引

基于融合专家网络与深度强化学习的智能流量编排方法

编排方法卷积长短期记忆深度强化学习时序神经网络策略

基于大语言模型的多智能体强化学习环境自动构建方法及系统

站点导航

APP 下载