摘要
本申请公开一种融合强化学习和CMA‑ES的设计变量优化方法及系统,涉及工程优化设计领域,方法包括:确定桁架车身设计变量;构建高斯过程代理模型、策略网络和评价网络;采用CMA‑ES算法对种群及状态信息进行迭代更新,直至达到设定迭代次数后,输出本次优化轨迹下的状态信息序列;基于本次优化轨迹下的状态信息序列、状态价值函数以及即时奖励,采用强化学习训练策略网络和评价网络;判断本次优化轨迹是否达到设定优化轨迹训练次数;若是,则基于强化学习训练好的策略网络,采用CMA‑ES算法对种群及状态信息进行迭代更新,直至达到设定迭代次数后产生最优种群。本申请提高了桁架车身设计变量的优化效率。
技术关键词
桁架车身
协方差矩阵
变量
网络
策略
轨迹
特征值
算法
序列
参数
生成结构
计算机系统
处理器
存储器
数据
比率
规模
节点
误差
系统为您推荐了相关专利信息
融合多尺度特征
特征金字塔网络
道路图像检测方法
道路检测模型
融合知识图谱
特征提取模块
融合语义信息
图片
空间金字塔池化
模块结构
多模态
校准方法
强化学习代理
在线参数辨识
模态传感器
着装检测方法
轻量型
注意力机制
计算机可读取存储介质
sigmoid函数
LSTM模型
皮尔逊相关系数
序列
Adam算法
短期电力负荷预测