摘要
本发明涉及路径规划技术领域,尤其涉及一种基于IDCAC的移动机器人路径规划方法,包括:利用Agent获取线速度和角速度、障碍物分布;分别设置Agent的线速度奖励值和角速度奖励值,利用线速度的最大值和当前值抑制Agent偏离度;利用角速度的最大值和当前值抑制Agent角速度偏差;设置外在奖励值,利用外在奖励和基于线速度和角速度的内在奖励建立混合奖励机制;基于辅助学习和策略学习构建协作导航架构;利用DDPM模型和对比学习生成虚拟数据并对其进行交叉匹配奖励预测模拟多样化数据,将对比学习特征嵌入策略学习中作为辅助训练。本发明解决常用的降维技术在减小维度会造成数据的丢失问题。
技术关键词
移动机器人路径规划方法
移动机器人路径规划系统
计算机程序代码
样本
学习特征
路径规划技术
障碍物
数据
策略
噪声
处理器
机制
偏差
锚点
指令
存储器
因子
介质
系统为您推荐了相关专利信息
数据
生成三维点云
三维点云模型
移除噪声
三维扫描设备
围岩分级方法
指标
隧道施工期
样本
Pearson相关系数
图像识别模型
图像识别方法
分辨率
航拍设备
计算机可执行指令
存算一体芯片
权重调节方法
忆阻器单元
语音识别模型
神经网络模型
Copula函数
场景构建方法
参数估计法
负荷
时序