一种人类偏好辅助的飞行员行为模仿方法和系统

正文

推荐专利

申请号：CN202510269386

申请日期：2025-03-07

公开号：CN120143843A

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开一种人类偏好辅助的飞行员行为模仿方法和系统，利用非完美飞行员演示和有限的人类偏好进行高效的无人机控制策略学习，所述非完美飞行员演示是指由人类飞行员无人机控制场景中采样的轨迹集合；所述无人机控制场景建模为一个马尔科夫决策过程；所述轨迹为某种方法在环境中连续采样多个时间步构成的状态动作对的集合；所述人类偏好为人类对于两条轨迹的偏好，即比较两条轨迹并给出某条轨迹由于另一条轨迹的结果；所述策略为在环境中采样的某种方法；本发明学到的策略性能可以突非完美演示的性能瓶颈。本发明可以应用于无人机飞行控制技术领域，具有广泛的应用前景。

技术关键词

神经网络参数轨迹人类 SAC算法无人机梯度下降法数据更新超参数计数器控制策略计算机设备可读存储介质场景采样模块处理器决策

系统为您推荐了相关专利信息

一种风电场的有功减载优化控制方法、系统、设备和存储介质

优化控制方法约束控制器风电机组网络风电场有功功率

一种基于人工智能的土壤深松耕作农机设备

土壤深松耕作农机设备土壤成分传感器数据传输模块机器学习算法

一种无人水下航行器的滑模轨迹控制方法、系统、设备、介质及产品

无人水下航行径向基函数神经网络轨迹控制方法轨迹控制系统水流

一种基于视频人工智能的煤矿开采数据管理系统及方法

数据管理系统场景识别分析资源共享人工智能识别 AR虚拟技术

一种基于横纵向解耦的车辆队列弯道行驶稳定性控制方法

行驶稳定性控制速度跟踪控制器间距控制器队列状态空间方程

一种人类偏好辅助的飞行员行为模仿方法和系统

站点导航

APP 下载