摘要
本发明提供一种芯片布局模型训练及运用方法、装置、电子设备及存储介质,属于人工智能技术领域,训练方法包括:按顺序控制智能体序列的每个智能体执行基于所有智能体在当前时刻的状态信息确定的预测动作并获取执行信息,遍历智能体序列后,根据所有执行信息计算策略网络和价值网络的损失函数值,以对芯片布局模型中策略网络和价值网络的结构参数进行更新。本发明在芯片布局模型仅设置一个策略网络和价值网络的情况下,按顺序控制智能体执行预测动作,在所有智能体均执行一次预测动作之后,依据每次执行预测动作获取的所有执行信息更新模型结构参数,使得训练完成的芯片布局模型能够适用于器件数量各不相同的芯片布局,提高了模型泛化性能。
技术关键词
布局
模型训练方法
芯片
网络
策略
重叠面积
序列
非暂态计算机可读存储介质
样本
参数更新模块
轨迹
模型训练装置
表达式
电子设备
关系
人工智能技术
处理器
布线
系统为您推荐了相关专利信息
大语言模型
数据处理模块
数据采集模块
答案
深度学习网络
自动保护装置
液冷机柜
PLC控制单元
液冷回路
管路系统
协同优化控制方法
模型预测控制框架
空调
最小化系统
微电网
喷砂设备
工件
控制决策模块
层次分析算法
控制执行模块