摘要
本发明涉及一种基于奖励修正的强化学习的逻辑综合序列优化空间探索方法及系统,属于电子设计自动化技术领域,将逻辑综合过程嵌入到基于奖励修正的强化学习算法中,将逻辑综合过程建模为强化学习的环境,实现自动探索逻辑综合序列优化空间。针对逻辑综合场景对强化学习算法进行了改进,进行了特征提取和动作编码,提高了电路状态表示的精度,扩大了搜索空间。本发明通过加入奖励修正,增加了训练前期的探索能力,由智能体训练得到自适应的奖励函数,减少了先验知识对电路优化方向的限定造成的性能的下降,在满足延迟约束的条件下,获得更优的逻辑综合面积结果。
技术关键词
综合工具
逻辑
脚本
策略
强化学习算法
序列
网络
电子设计自动化技术
轨迹
编码器
解码器
智能体模型
参数
探索系统
数据
特征提取模块
测试电路
系统为您推荐了相关专利信息
冷量补偿方法
电机电流数据
可编程逻辑控制器
队列
稳态
序列优化方法
抗菌肽
节点
属性预测模型
多源特征融合