摘要
本申请公开了一种基于DDPG的抗干扰弹智能制导控制方法、装置、介质和设备,通过基于目标飞机运动方程、导弹运动方程、红外干扰弹运动方程和红外干扰弹能量模型构建集成模型,基于集成模型确定环境状态数据;基于深度强化学习模型、策略梯度算法联合TD‑error算法构建改进深度强化学习模型,利用改进深度强化学习模型处理环境状态数据,得到经验数据,利用多个经验数据联合迭代训练改进深度强化学习模型,得到最终的改进深度强化学习模型:利用最终的改进深度强化学习模型抑制红外干扰弹影响并修正导弹弹道轨迹以追踪目标,本申请应用于强化学习训练过程中,该训练过程具有快速高效的特点。
技术关键词
深度强化学习模型
红外干扰弹
制导控制方法
飞机运动方程
携带导弹
加速度
网络
梯度算法
数据
在线
制导控制装置
表达式
策略
输入输出单元
系统为您推荐了相关专利信息
六自由度并联机构
核心控制单元
补偿算法
结构光视觉
深度强化学习模型
任务调度方法
深度强化学习模型
集群资源利用率
决策
指标
改进型遗传算法
协同控制方法
容灾机制
数字孪生模型
标准化接口
强化学习方法
四足机器人
动态平台
深度强化学习模型
强化学习框架