一种基于离线强化学习的原型可解释飞行器控制方法

正文

推荐专利

申请号：CN202510635110

申请日期：2025-05-16

公开号：CN120491515A

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开了一种基于离线强化学习的原型可解释飞行器控制方法，包括：获取目标飞行器的当前观测状态，将当前观测状态输入到训练后的飞行器控制模型中，输出当前观测状态对应的动作决策；其中，飞行器控制模型的训练步骤包括：从飞行器在不同环境条件下执行历史任务的离线数据集中，获取多条飞行器轨迹数据；从多条飞行器轨迹数据中，提取训练数据集；利用训练数据集优化飞行器控制模型的参数，获得训练后的飞行器控制模型。该方法通过从大量离线数据中学习，将复杂的参数设置问题转化为数据采样问题，大大简化了参数调整的复杂度；通过离线学习，显著提高样本效率，无需和环境进行交互，显著提高样本效率。

技术关键词

飞行器控制模型飞行器控制方法原型优化飞行器离线数据序列轨迹线性语义特征提取决策参数阶段时序样本复杂度框架代表

系统为您推荐了相关专利信息

一种基于模型驱动的自适应LDPC译码方法

LDPC译码方法校验矩阵译码器校验结构编码

一种适用于单事件采集数据的重建方法

探测器成像设备校正像素点队列

用于NFC芯片FPGA原型验证的电路及设备

FPGA原型验证 RF接口 NFC芯片输出缓冲器电源转换模块

一种面向GF6-WFV数据各向异性反射的校正方法及系统

辐射传输模型多角度遥感数据分块校正方法核驱动模型

一种离线继电器批量测试装置

电流感应放大器数据处理单元人机交互单元采样电阻测试模块

一种基于离线强化学习的原型可解释飞行器控制方法

站点导航

APP 下载