摘要
本发明公开了一种基于动态加权机制的无人夹抱车路径优化方法,包括以下步骤:步骤1,使用图搜索算法生成一条粗略路径Psearch;步骤2,策略神经网络Actor根据实时障碍物信息、车辆状态基于当前策略优化后输出一条路径Pactor;步骤3,动态加权机制:将图搜索生成的粗略路径Psearch作为参考路径,计算其与路径Pactor的相似性损失Lsimilarity,强化学习模型的评价网络Critic对Actor生成的路径Pactor进行打分,生成路径质量损失Lcritic,将二者动态加权计算总损失Ltotal,根据累计回报Ireward、路径稳定性Istability和路径平滑性Ismoothness,动态调整动态权重因子α。本发明根据实时环境动态调整权重,动态适应不同训练阶段的需求,从而优化路径规划质量和效率。
技术关键词
路径优化方法
夹抱车
动态
强化学习模型
机制
粗略
网络
策略
障碍物
搜索算法
因子
车辆定位
终点
参数
时序
指数
规划
坐标
阶段
系统为您推荐了相关专利信息
智能合约系统
虚拟机执行环境
隐私保护机制
加密技术
细粒度权限控制
综合评估模型
分布式存储集群
企业
集成学习算法
能源计量仪表