摘要
本发明提供了一种面向封装测试系统生产调度的改进双深度Q网络算法,本发明在原DDQN的基础上进行了优化,首先,为了提高智能体的学习速度和调度解的质量,提出了一种与总工序数相关的指数型自适应动作选择策略。其次,为了实现IDDQN算法的自适应性,设计了一种与问题规模大小密切相关的自适应网络参数更新策略。与此同时,考虑到在线网络对目标网络的影响程度,本发明设计了一种加权的目标网络参数更新策略,实现目标网络参数逐步朝着更优参数方向转变,并降低在线网络参数θ较差时对目标网络参数的影响。最后,结合封装测试车间的实际调度情况,并针对先选工件后选机器调度规则性能差的实际现状,提出了基于先选机器后选工件的复合调度规则。
技术关键词
封装测试系统
深度Q网络
参数
半导体封装测试
贪婪策略
车间
深度强化学习
工件特征
规则设计
矩阵
判断算法
在线
指标
计划
分层
因子
系统为您推荐了相关专利信息
多层感知机
温度反演方法
红外光谱仪
Softmax函数
光谱数据处理技术
神经网络模型
迭代计算方法
多尺度特征提取
计算机程序指令
梯度下降法
驾驶仿真测试方法
实车数据
仿真测试系统
封装模块
车辆
稳定控制方法
动态控制分配方法
径向基函数神经网络
滑模控制方法
补偿控制器
智能运维管理方法
电力线路设备
轨道交通牵引设备
指标
展示设备