摘要
本发明公开了一种基于强化学习的高强度片区热环境性能空间设计决策方法,涉及城市热舒适性评估与优化技术领域。该方法包括:分别对建筑Agent和树木Agent的状态空间、动作空间和奖励函数进行定义;利用近端策略优化算法训练建筑Agent,基于建筑Agent的训练结果利用近端策略优化算法训练树木Agent;应用训练好的建筑Agent和训练好的树木Agent协同生成待优化片区中建筑与树木的最优布局。该方法通过强化学习算法动态调整建筑布局和树木布局,在随机地块形状和容积率约束下,生成满足热舒适性需求的建筑排布和树木排布方案,可快速优化城市热环境的热舒适性指标,为城市规划和建成环境优化提供科学支持。
技术关键词
建筑
决策方法
布局
覆盖率
参数
历史气象数据
指标
网络
策略
城市热环境
网格
坐标
强化学习算法
优化器
尺寸
重叠面积
顶点
偏差
数值
系统为您推荐了相关专利信息
综合状态评估
综合健康指数
仿真平台
概率密度函数
动态调整机制
环境声音分类
跨层连接结构
网络模块
超参数
进化算法
花岗伟晶岩
散射反照率
Hapke模型
波长
反射率