摘要
本发明公开了一种应用于无人机自主导航训练的正弦衰减A3C算法,在融入先验策略的A3C算法中,通过正弦函数动态调整先验策略衰减参数,解决了先验策略衰减不协调的问题。训练初期,高占比先验策略给予充足的指导;训练后期,低占比先验策略释放学习网络自主优化能力,避免局部最优。本发明通过设计正弦衰减函数,首先确定先验策略衰减参数的初始值,然后根据正弦函数的性质,构建先验策略衰减参数随训练迭代次数变化的关系,使其进行非线性增长,优化A3C算法,在A3C网络训练过程中,将正弦函数衰减后的先验策略影响和学习网络生成的策略进行融合,以此实现先验策略影响在训练过程中的动态调整。
技术关键词
无人机自主导航
无人机飞行速度
策略
算法
网络
参数
障碍物
动态
视角
坐标
非线性
定义
模式
关系
系统为您推荐了相关专利信息
合规性验证方法
周期监控
消毒设备
消化内镜
推理机制
啁啾信号
手势追踪方法
距离信息
追踪系统
麦克风
特征融合网络
高光谱遥感图像
输出特征
空间光谱特征
矩阵
人工神经网络
单位面积产量
多层前馈神经网络
农业智能灌溉
智能灌溉系统