一种基于深度强化学习与注意力机制的宏观工艺决策方法

正文

推荐专利

申请号：CN202411064499

申请日期：2024-08-05

公开号：CN118887035A

公开日期：2024-11-01

类型：发明专利

摘要

本发明属于宏观工艺决策技术领域，尤其涉及一种基于深度强化学习与注意力机制的宏观工艺决策方法，包括：S1、通过聚合决策图G对MPP实例进行图表示；S2、使用特征提取网络，将聚合决策图Gt的节点原始动静态特征沿着Gt的拓扑结构信息映射到Embedding空间S3、基于聚合决策的马尔可夫过程来形式化MPP问题，将MPP问题转化为一个四元组<S,A,P,R>马尔科夫决策过程；S4、以所有工件的最小化完工时间为决策目标，对S3的马尔科夫决策过程进行求解；S5、使用S3得到的宏观工艺决策进行实际加工。本方法可以在将DRL应用于MPP问题时，综合考虑对工序、设备和刀具之间复杂的约束和关系，在充分提取MPP问题状态信息的基础上实现高效决策，成为目前亟待解决的问题。

技术关键词

深度强化学习注意力机制决策方法特征提取网络动静态特征拓扑结构信息策略更新网络参数前馈神经网络刀具节点特征邻居线性模块

系统为您推荐了相关专利信息

基于零样本难度感知的大语言模型路由方法、装置和设备

大语言模型样本数据语义特征嵌入特征

基于多模态时序注意力的交通参与者意图预测方法及装置

意图预测方法多模态意图类别交通融合特征

基于文本-点云匹配的地点识别模型构建方法及系统

识别模型构建方法文本编码模块跨模态模态特征

一种大坝变形量的预测方法、系统、设备及存储介质

回归算法引入注意力机制编码器集成学习算法网络

基于空间特征编码与几何感知注意力计算的点云配准优化方法

K近邻算法嵌入特征多阶段特征提取模块三元组

一种基于深度强化学习与注意力机制的宏观工艺决策方法

站点导航

APP 下载