摘要
本发明公开了一种在进化计算中基于深度强化学习的自动算法配置方法,包括:确定问题集;获取构建马尔可夫决策过程的初始数据;根据所述初始数据使用个体状态向量定义进化计算算法中每个个体在时间步的状态向量;根据所述初始数据构建种群特征、个体特征和开发特征的特征向量;根据所述初始数据定义连续动作空间,共同控制所有个体对超参数的选择;基于是否找到更好的解决方案,设置奖励机制,实现最大化预期收益;深度强化学习智能体利用注意力机制,控制算法的动态超参数,实现马尔可夫决策过程,完成自动算法配置。本发明实现由高维的感知信息到连续动作空间输出的直接映射,动态调整个体的探索开发权衡的配置,优化探索与开发的平衡机制。
技术关键词
算法配置方法
深度强化学习
强化学习策略
超参数
决策
连续动作空间
编码特征
多头注意力机制
交互注意力
处理器
特征提取网络
概率密度函数
可读存储介质
编码模块
存储器
系统为您推荐了相关专利信息
复合机器人系统
权限管理机制
节点
集成模块
权限管理模块
人机协作
装配线
任务分配方法
整数规划模型
多智能体系统
合成孔径雷达影像
油罐
特征提取器
Gamma滤波
合成孔径雷达图像
皮尔逊相关系数
数据
读取存储介质
烟叶图像
随机森林