摘要
一种基于改进PPO‑RND算法的工业互联环境下机床装备资源自适应优选方法,包括:1)对机床装备资源进行建模,并建立生产扰动模型;2)将机床装备资源优选过程建模为六元组MR‑MDP;3)设计机床装备资源优选过程MR‑MDP的奖励函数;4)构建改进的PPO‑RND算法框架;5)利用改进的PPO‑RND算法框架对机床装备资源优选过程MR‑MDP进行求解,得到各机床装备资源组合及对应的动作;在生产扰动发生后,对各机床装备资源组合及对应的动作进行重优选。本发明具备优异的鲁棒性,为工业互联制造服务的稳定可靠运行提供了一定的理论方法支撑。
技术关键词
机床装备资源
算法框架
设计机床
序列
工业
输出特征
参数
前馈神经网络
分支
定义策略
索引
指标
误差函数
传播算法
代表