摘要
本发明涉及人工智能技术领域,提供一种防御型路径规划方法、装置和电子设备,包括:根据给定的路径规划任务确定栅格化地图、起始节点和多个候选目标节点;基于栅格化地图构建并训练基于强化学习的路径规划模型得到训练后的最短路径模型;利用训练后的最短路径模型初始化智能体得到初始化后的智能体;基于获取的观察者预测结果训练初始化后的智能体得到防御型路径规划智能体;基于该智能体进行路径规划得到目标路径。本发明可以得到一种能够自适应学习型观察者的防御型路径规划智能体,智能体在规划路径时不仅考虑最短路径,还考虑路径的防御性,以规避外部观察者的预测。该发明方法能够扩展应用到其他涉及隐私保护和对抗策略的规划任务中。
技术关键词
路径规划方法
节点
观察者
强化学习算法
栅格
地图
非暂态计算机可读存储介质
优化网络参数
路径规划装置
模型训练模块
电子设备
处理器
人工智能技术
计算机程序产品
代表
策略
存储器
系统为您推荐了相关专利信息
神经网络模型
温度预测方法
温控系统
温度预测模型
粒子群优化算法
动车转向架
机械零件
列车转向架
可视化系统
拓扑图
密钥加密系统
国密算法
监测运行状态
生成对抗网络模型
检测异常状态
入侵检测系统
隐马尔可夫模型
风险评估模型
样本
长短期记忆网络