摘要
本申请公开了一种基于深度学习与强化学习的自适应控制优化方法,涉及工业智能控制技术领域,本申请通过根据采集到的数据构建掩码矩阵,再通过将多尺度时序卷积层和图卷积网络与数据的掩码矩阵相结合,生成未来步数的预测值,据此构建时空融合深度学习模型,进而根据时空融合深度学习模型的预测值,构建状态向量,从而根据状态向量生成最佳控制策略,本申请通过将时空融合深度学习与强化学习的嵌入式协同,构建预测‑决策‑执行的全闭环工业控制架构,针对传感器数据部分缺失及多变量非线性耦合的复杂工业场景,在边缘控制器内实现推理‑控制一体化,实现了高精度、强鲁棒性的自适应控制优化。
技术关键词
融合深度学习模型
掩码矩阵
边缘控制器
驱动执行机构
控制策略
强化学习策略
网络
工业智能控制技术
传感器
时序
融合特征
级联
多尺度
可编程逻辑控制器
闭环控制
决策
实时数据