摘要
本申请适用于深度强化学习技术领域,提供了一种用于建筑能源控制的深度强化学习方法及系统,该方法包括:基于目标建筑环境构建智能体;收集智能体与目标建筑环境进行交互时的普通经验数据;构建提示文本;将提示文本输入大语言模型,得到控制动作的动作范围;根据动作范围对普通经验数据进行修正处理,得到基于LLM修正的经验数据;根据普通经验池和LLM经验池,通过最小化损失函数对智能体进行训练。本申请利用大语言模型分析不同环境状态下的控制动作的动作范围,从而对智能体随机探索中低质量的经验数据进行指导修正,使智能体能够获得高质量经验,提高建筑能源控制策略学习的效率和整体性能。
技术关键词
建筑能源控制
深度强化学习方法
能源控制策略
网络
表达式
大语言模型
文本
深度强化学习技术
数据存储
建筑能源系统
舒适度
意图
模块
参数
储能系统
因子
系统为您推荐了相关专利信息
无人车库
系统监控模块
车辆识别模块
查询车辆位置
预订停车位
三维测绘系统
三维物体模型
大数据
视角
深度回归模型