摘要
本发明公开了一种面向芯片设计验证的强化学习SAT求解方法及系统,本发明方法包括将CNF公式使用SAT求解器进行求解,且在求解过程中保存的相位值为基于多臂博弈算法的重相位策略对变量进行赋值得到,包括选择重相位启发式组合成多种重相位策略作为多臂博弈算法的臂,在求解过程中统计冲突次数和决策次数以计算每个臂的奖励函数值,利用上置信界算法从多个臂中选择侯选的重相位策略,利用实例中的变量个数设置重相位启发式切换及使用多臂博弈算法选择侯选重相位策略的基本冲突次数间隔。本发明旨在利用多臂博弈算法在SAT求解器求解实例的过程中动态的选择重相位启发式加快SAT求解过程,增加求解出的实例个数及减少实例求解时间。
技术关键词
芯片设计验证
博弈算法
策略
变量
学习算法
SAT求解器
表达式
微处理器
可读存储介质
芯片验证
决策
求解系统
计算机程序产品
编程
指令
轨迹
存储器