摘要
本申请公开了一种基于长短期记忆网络的飞机回收动态调度方法,涉及人工智能与自动化调度领域,该方法包括:基于策略网络、目标网络以及优先经验回放存储器,在每个并行的飞机回收模拟环境中,通过循环策略过程生成回收轨迹,在每个决策步中按照所述回收轨迹回收飞机;当优先经验回放存储器中的样本量满足预设批次数量时,采样一个批次的经验数据,利用目标网络计算经验数据中任一经验样本下一状态的Q值,更新策略网络的参数,同步更新所述目标网络的参数,记录每次更新后的网络更新参数,并根据更新后的目标网络和策略网络确定飞机回收动态调度模型,以执行回收任务,本申请能够深入理解时序动态、实现高效学习并适应随机环境的智能调度回收。
技术关键词
动态调度方法
长短期记忆网络
飞机
加权损失函数
动态调度模型
样本
序列
批量数据
存储器
参数
决策
多层感知机层
燃油
轨迹
深度神经网络
编码
贪婪策略
系统为您推荐了相关专利信息
速度编码器
匈牙利算法
位置编码器
LSTM模型
轨迹
刀具磨损检测方法
刀具磨损状态
多模态
卷积神经网络模型
分布特征
废气涡轮
输配电装置
燃料电池冷却模块
氢燃料电池
仿真模拟装置
多尺度特征融合
退化特征
数据采集模块
训练深度学习模型
长短期记忆网络
作弊方法
拜占庭容错
深度学习神经网络
保护用户隐私数据
分布式协同