摘要
本发明属于宏观工艺决策技术领域,尤其涉及一种基于深度强化学习与注意力机制的宏观工艺决策方法,包括:S1、通过聚合决策图G对MPP实例进行图表示;S2、使用特征提取网络,将聚合决策图Gt的节点原始动静态特征沿着Gt的拓扑结构信息映射到Embedding空间S3、基于聚合决策的马尔可夫过程来形式化MPP问题,将MPP问题转化为一个四元组<S,A,P,R>马尔科夫决策过程;S4、以所有工件的最小化完工时间为决策目标,对S3的马尔科夫决策过程进行求解;S5、使用S3得到的宏观工艺决策进行实际加工。本方法可以在将DRL应用于MPP问题时,综合考虑对工序、设备和刀具之间复杂的约束和关系,在充分提取MPP问题状态信息的基础上实现高效决策,成为目前亟待解决的问题。
技术关键词
深度强化学习
注意力机制
决策方法
特征提取网络
动静态特征
拓扑结构信息
策略
更新网络参数
前馈神经网络
刀具
节点特征
邻居
线性
模块
系统为您推荐了相关专利信息
识别模型构建方法
文本
编码模块
跨模态
模态特征
回归算法
引入注意力机制
编码器
集成学习算法
网络
K近邻算法
嵌入特征
多阶段
特征提取模块
三元组