基于大语言模型的多智能体强化学习环境自动构建方法及系统

AITNT
正文
推荐专利
基于大语言模型的多智能体强化学习环境自动构建方法及系统
申请号:CN202510462927
申请日期:2025-04-14
公开号:CN120542595A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开一种基于大语言模型的多智能体强化学习环境自动构建方法及系统,属于人工智能领域。所述方法包括:解析多智能体强化学习环境构建的任务描述,获取所述任务描述中的关键信息和高质量配置示例;基于所述任务描述中的关键信息和高质量配置示例,构建用于生成配置的第一思维链提示词之后,生成任务环境配置信息;将任务环境配置信息转化为任务环境候选配置,并计算任务环境候选配置的配置评分;结合配置评分对任务环境配置信息进行优化;根据所有配置评分,选取任务环境候选配置进行多智能体强化学习环境的构建。本发明可以提高多智能体强化学习任务环境的配置效率,缩短多智能体强化学习在不同任务环境中的适应性和泛化性研究的周期。
技术关键词
环境配置信息 多智能体强化学习 大语言模型 强化学习环境 自动构建方法 生成模板 坐标 地形特征 构建系统 信息检索 列表 模块 规模 格式 代表 算法 标签 场景 周期
系统为您推荐了相关专利信息
1
一种基于绩效模型的银行客户经理积分处理方法及系统
客户关系管理系统 机器学习算法 核心业务系统 数据清洗技术 财务管理系统
2
一种基于双曲空间视觉与语言对齐的果蝇行为识别方法
语义向量 关键点 对齐模块 训练样本集 特征提取模块
3
学习TrainDLenGap的隐式机制协助大语言模型开发的方法及系统
大语言模型 机制 数据集构建方法 变量 支持向量机算法
4
基于大模型感知的多样化司法指令数据选择方法及系统
标签 指令 数据 标记 索引
5
基于融合专家网络与深度强化学习的智能流量编排方法
编排方法 卷积长短期记忆 深度强化学习 时序神经网络 策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号