摘要
本发明公开了一种神经网络控制律高效自主学习方法。针对在运用深度强化学习算法实现复杂飞行器控制律自学习的过程中,超参数设定高度依赖于人工经验进而造成设计难度大,且不一定对于任务最优的问题,本发明引入图像识别领域网络架构搜索思想,提出基于神经网络架构轻量化搜索策略的飞行器控制律自学习方法。该方法在将神经网络架构设计问题转化为图拓扑生成问题的基础上,结合LSTM循环神经网络的图拓扑生成算法、基于权重共享的深度强化学习参数轻量化训练与评估机制,以及基于策略梯度的图拓扑生成器参数学习算法,实现了深度强化学习训练算法中神经网络架构超参数的自动优化,进而完成了控制律的自学习。
技术关键词
自主学习方法
节点
神经网络架构
自动生成器
加速度
飞行器
深度强化学习算法
坐标
神经网络参数
神经网络结构
超参数
推力
训练算法
解码器
生成算法
系统为您推荐了相关专利信息
灾害风险评估
基础设施系统
网络拓扑模型
级联
变电站
异常识别方法
锂电池
信号特征
进化优化算法
重构模型
风电机组塔架
粒子群优化算法
模糊推理模型
预警方法
变量