摘要
本发明公开了一种基于深度强化学习的智能割平面选择方法,所述方法包括:构建神经网络模型并以其取代混合整数线性规划问题MILPs求解器SCIP的割平面选择组件;收集混合整数线性规划问题MILPs的状态信息;将状态信息构建为异构三分图,并以其作为神经网络模型的输入得到所选割平面序列;将所选割平面序列作为动作信息并根据其求解MILPs得到奖励信息,将状态、动作以及奖励信息构建为数据集;利用Actor‑Critic算法根据数据集训练神经网络模型,训练完成得到神经网络模型作为SCIP求解器的割平面选择组件。本发明所述的智能割平面选择方法提升了MILPs的求解性能以及稳定性。
技术关键词
混合整数线性规划
深度强化学习
训练神经网络模型
策略
变量
异构
约束特征
松弛
模块
节点
序列
多层感知机
解码器
参数
算法
指针
年龄
系统为您推荐了相关专利信息
公交车
充电调度方法
机会约束规划
光伏发电功率
储能电池剩余电量
控温结构
加热模块
模糊PID复合控制
控温单元
热流传感器
水电站排水系统
诊断方法
注意力机制
中央数据处理单元
流量传感器