摘要
本发明公开了一种基于强化学习的无人机路径规划避障方法,包括如下步骤:S1、采集多模态传感数据并初始化经验回放池;S2、构建动态图并输入时空图注意力卷积网络,生成状态嵌入向量;S3、将状态嵌入向量输入改进型软演员评论家模型,输出三分支高斯分布参数;S4、调整方差生成风险自适应噪声分支;S5、按分支权重加权采样生成动作候选集;S6、输入隐式分位评论家与安全评论家,剔除低安全值动作;S7、选择最优动作指令并执行,获取环境反馈和下一状态;S8、将状态嵌入向量、最优动作指令、环境反馈和下一状态写入经验回放池并更新模型参数。本发明提高了无人机在复杂环境中的避障能力与路径规划效率。
技术关键词
无人机路径规划避障方法
分支
空间邻近关系
激光雷达点云
注意力
网络
指令
生成动作
样本
路径规划效率
多模态
事件流
风险
数据
滑动时间窗口
更新模型参数
无人机平台
噪声
节点
系统为您推荐了相关专利信息
编程教学方法
少儿
编程教学技术
程序执行路径
项目