摘要
本发明公开了一种基于改进DT的自适应无人机轨迹优化与资源分配方法,属于无人机边缘计算技术领域,包括:对DT模型进行改进;使用约束强化学习算法收集不同电池约束下收集数据;对改进后的模型进行预训练,生成决策动作,计算奖励和能耗成本,并将收集的状态、动作、奖励、成本拼接成轨迹片段;利用收集的轨迹片段进行微调,优化无人机的轨迹选择、用户关联与频带分配决策,以最大化奖励。本发明采用上述方法,通过对DT模型进行改进提高了边缘计算模型的效率与安全性,实现了在无线环境的约束条件变化时的良好泛化适应性。
技术关键词
无人机轨迹优化
资源分配方法
强化学习算法
无人机电池电量
系统吞吐量
频带分配
决策
状态信息数据
边缘计算技术
能耗
轻量化方法
模型预训练
输入模块
队列
指数
变量
误差