摘要
本发明提供一种基于强化学习的水性胶喷涂路径规划方法及系统,获取工件的三维模型和喷涂工艺参数,通过策略网络与喷涂环境交互生成轨迹数据,并利用价值网络计算优势估计值及其方差。当喷涂质量未达标时,系统根据优势估计值的方差构建训练数据集,更新价值网络并优化策略网络参数。接着,系统将工件表面转换为离散图结构,建立地标集合并计算各点间的代价,利用价值网络生成节点热图。根据当前喷涂区域的几何属性和精度要求,系统确定地标子集并计算地标贡献值。当实际表面与模型存在偏差时,系统调整地标贡献值,并利用地标子集和贡献值计算全局引导轨迹,最终生成可执行喷涂路径指令序列。
技术关键词
地标
路径规划方法
水性胶
生成可执行
轨迹
节点
路径规划系统
网络
喷涂工艺
三维模型
指令序列缓冲器
机器人运动控制器
工件
策略
数据
路径搜索方法
喷枪
偏差
参数